Teilweise Problem mit Japanisch in Firefox

  • Hallo!


    Ich habe gestern mit <a href="http://www.drupal.org">drupal</a> auf meiner <a href="http://www.cryss.net">Website</a> einen ersten japanischen Eintrag gemacht.
    Das klappt soweit auch. Nur wurde der Titel irgendwie umkodiert: Das sieht dann so aus wie # und ne 5- oder 6-stellige Nummer. Ihr wisst sicher was ich mein. Der Body Text war in Ordnung.
    Im drupal forum sagte mir man, daß liege an der Zeichenencodierung im Firefox. Ich müsse das auf UTF-8 umstellen (Standardencodierung in den Einstellungen).
    Ich habe jetzt nur das Problem, daß ich häufig manuell nochmal auf UTF-8 stellen muss, weil Firefox wieder auf Westlich ISO8859-1 umstellt.

    1. Wie kann ich das ändern.

    2.
    Geh ich auf editieren des Beitrags wird auch der Body Text (ist eine form) in dieses #+Nummern umgewandelt. So kann ich natuerlich nix mehr lesen. Da hilft auch keine manuelle Umstellung auf UTF-8.

    3. Erstelle ich Beiträge in japanisch mach ich das immer mit UTF-8 oder?
    So gibt es dann keine weiteren Probleme. Der Leser muss nur jap. Schriftarten installiert haben und seine Zeichenencodierung evt. manuell auf UTF-8 umstellen. Seh ich das richtig?

    4. in ISO8859-1 erstelle Beiträge bekommen nach Umstellung im Browser auf UTF-8 Anzeige für Umlaute Fragezeichen. Ich dachte dafür ist UTF-8 gedacht. Um ALLES anzeigen zu können.

    5. Ich habe meinen ersten Eintrag mit ISO8859-1 gemacht. Der Titel ging nicht aber der Bodytext in japanisch. Nach dem editieren hab ich es angesehen und es wird mit ISO8859-1 auch japanisch angezeigt. Vielleicht hab ich was grundlegendes mit Zeichenecodierung nicht verstanden, aber ich dachte deswegen muss ich UTF-8 (bzw. ISO-2022-jp) benutzen.

    Danke,
    Christian

  • Vermutlich sendet der Server die Zeichensatz-Angabe Latin-1 (ISO 8859-1).

    Wenn das passiert glaubt der Browser(der eher dem Server als der Seite glaubt), daß die Datei mit diesem Zeichensatz kodiert ist und zeigt sie auch so an - unabhängig davon ob die Seite selbst tatsächlich in UTF-8 oder Latin-1 geschrieben ist. (Das kann der Browser selbst nicht feststellen, er vertraut dem Server.)

    Lt. Rex Swain´s HTTP viewer wird die Seite http://www.cryss.net/ mit Latin-1(ISO 8859-1) geschickt.

    Versuch dem Server zu sagen daß er die Dateien als UTF-8 schicken soll. Bei Apache verwendet man dazu die .htaccess Datei mit Befehl AddCharSet .

    [edit] Latin-1 beinhaltet sicher keine japanischen Zeichen - vermutlich wurden sie durch entities ersetzt(z.B. & für & ).

  • Also ich wollte eben im root meiner Domain .htaccess anlegen.
    In dieser steht:
    AddDefaultCharset utf-8
    AddCharset utf-8

    Jetzt bekomme ich einen Internal Server Error 500.
    Muss ich meinen Provider jetzt bitten das zu setzen bzw. mir in meiner .htaccess Datei die Erlaubnis geben?

  • Bei AddCharSet muß noch die Dateierweiterung angegeben werden- ev. liegts daran.
    Kann aber auch sein daß es vom übergeordneten Root(sofern vorhanden) verboten wurde - genau weiß ich das leider auch nicht.

    Bei mir steht:

    Code
    AddDefaultCharSet utf-8
    AddCharSet utf-8 .shtml .htm .html
    AddCharSet ISO-8859-1 .php

    Die letzte Zeile wird bei dir nicht nötig sein, denke ich.

  • Code
    AddDefaultCharset utf-8
    AddCharSet utf-8 .shtml .htm .html .php

    Jetzt kommt keine Fehlermeldung mehr, aber es wird immer noch falsch encodiert. Wenn vom Provider Restriktionen gesetzt worden wären, dann hätte ich sicher ne meldung bekommen, oder?

  • Nicht unbedingt - aber wie gesagt, ich kenne mich da nicht so genau aus.

    Was meinst du mit "Provider"? Der sollte eigentlich nichts damit zu tun haben, außer der Server steht bei ihm.
    Der Provider stellt nur die Internetverbindung zur Verfügung, das hier ist ein Serverproblem.

    Ich hab´ die Seite nochmal mit de HTTP Viewer geprüft, offenbar sendet er noch immer Latin-1 .

    Mehr weiß ich nicht - ev. kommt jemand der mehr Ahnung davon hat. Viel Glück noch.