none
获取excel单元格中字符的unicode值 RRS feed

  • 问题

  • 我的excel中有多种语言的字符,中文,英文,法文,德文,西班牙文
    我想要取出这些单元格中的字符的对应unicode值
    中文字符能正确的取出用gb2312解码,就能得到unicode编码
    但是德文,法文中的特殊字符不能用gb2312解码,而且用iso-8859-1编码好像也不对
    请问这种德文法文的单元格是怎么编码的?应该怎么取它们的unicode值?
    谢谢!
    2008年10月14日 9:49

答案

    1. 建议修改后用Unicode(UTF-8)保存德文文本,以后就用Unicode(UTF-8)这个语言修改
    2. 由于德语的计算机编码西欧语言,国际标准为ISO-8859-1,所以在中文系统中用纯文本无法正确显示变音字符,必须将德文文字转换为Unicode编码才能在文字编辑工具中正常显示。如果变音字符直接用中文编码保存再次打开就会变成乱码。特别是在使用默认GB2312的浏览器查看没有给出语言编码的德文网页时也会出现乱码。

    乱码的解决方案有2种。

    1.如果必要,使用Unicode(UTF-8)保存德文文本或者使用支持Unicode的编辑器编辑和保存。
    2.修改变音字符为标准ASCII字符。修改方法如下:ü=Ue ?=Ae ?=Oe ?=ss 这种方法适合不支持德文变音字符的软件中正常显示德语文字。例如GB2312编码的中文网页,中文新闻组,IM软件等。


    附录:所有语言的编码大全
    ISO 8859-1 (Latin-1) - 西欧语言 *网站翻译成德文就用这个编码
    ISO 8859-2 (Latin-2) - 中欧语言
    ISO 8859-3 (Latin-3) - 南欧语言。世界语也可用此字符集显示。
    ISO 8859-4 (Latin-4) - 北欧语言
    ISO 8859-5 (Cyrillic) - 斯拉夫语言
    ISO 8859-6 (Arabic) - 阿拉伯语
    ISO 8859-7 (Greek) - 希腊语
    ISO 8859-8 (Hebrew) - 希伯来语(视觉顺序)
    ISO 8859-8-I - 希伯来语(逻辑顺序)
    ISO 8859-9 (Latin-5 或 Turkish) - 它把Latin-1的冰岛语字母换走,加入土耳其语字母。
    ISO 8859-10 (Latin-6 或 Nordic) - 北日耳曼语支,用来代替Latin-4。
    ISO 8859-11 (Thai) - 泰语,从泰国的 TIS620 标准字集演化而来。
    ISO 8859-13 (Latin-7 或 Baltic Rim) - 波罗的语族
    ISO 8859-14 (Latin-8 或 Celtic) - 凯尔特语族
    ISO 8859-15 (Latin-9) - 西欧语言,加入Latin-1欠缺的法语及芬兰语重音字母,以及欧元(?)符号。
    ISO 8859-16 (Latin-10) - 东南欧语言。主要供罗马尼亚语使用,并加入欧元符号。
    ISO 8859-1 (Latin-1) - 西欧语言
    ISO 8859-2 (Latin-2) - 中欧语言
    ISO 8859-3 (Latin-3) - 南欧语言。世界语也可用此字符集显示。
    ISO 8859-4 (Latin-4) - 北欧语言
    ISO 8859-5 (Cyrillic) - 斯拉夫语言
    ISO 8859-6 (Arabic) - 阿拉伯语
    ISO 8859-7 (Greek) - 希腊语
    ISO 8859-8 (Hebrew) - 希伯来语(视觉顺序)
    ISO 8859-8-I - 希伯来语(逻辑顺序)
    ISO 8859-9 (Latin-5 或 Turkish) - 它把Latin-1的冰岛语字母换走,加入土耳其语字母。
    ISO 8859-10 (Latin-6 或 Nordic) - 北日耳曼语支,用来代替Latin-4。
    ISO 8859-11 (Thai) - 泰语,从泰国的 TIS620 标准字集演化而来。
    ISO 8859-13 (Latin-7 或 Baltic Rim) - 波罗的语族
    ISO 8859-14 (Latin-8 或 Celtic) - 凯尔特语族
    ISO 8859-15 (Latin-9) - 西欧语言,加入Latin-1欠缺的法语及芬兰语重音字母,以及欧元(?)符号。
    ISO 8859-16 (Latin-10) - 东南欧语言。主要供罗马尼亚语使用,并加入欧元符号。

    2008年10月25日 2:44
    版主