Skip to main content

Google Pinyin 自定义默认词典

自使用谷歌拼音(Google Pinyin)输入法以来,我几乎放弃了五笔输入法。为什么?键盘汉字输入量越大,拼音云输入在长句输入的优点越明显,可以完全遮盖五笔输入在单字、短词组的优势。这款输入法重度依赖者一定知道,谷歌能时刻保存你的输入习惯,如果有拼音重复的字、词、句,谷歌能根据你的键盘选取自动将选用频率最高的拼音排列首位,方便选取并提高拼音输入效率。

使用谷歌云输入法即时保存输入字词句也有弊端,它将键盘击打错误也保存在云服务器个人账户下。按照我检查自己谷歌拼音词典的发现,里面就有一定比例的同音别字,平时再次输入这段拼音时还会自动提取这些别字。自动保存拼音输入词典还有另外一个弊端:如果家庭多个成员公用一个 Google Pinyin 账户,多个人的输入习惯全部都记录在这个账号下。

虽然没有很奇怪的隐私,而且工作和私人交流的拼音输入都在一个谷歌账号下,有时候有点强迫的我还是习惯清理字典,让那些同音别字、错字、以及孩子的孩子气词语或句子都消失。

目前删除无效词典只有一个办法:点击「用户词典管理」清空按钮。操作很简单,不过得到的是谷歌默认的词典,自己常常使用的词组和句子全部会因此消失。正确和错误之间不好平衡。

好在找到了 Google 词典文件格式,其实用电子表格按照3列录入默认词典即可:

第一列:汉语字、词、句;
第二列:词频(1)
第三列:拼音字符串


按照 Google 的帮助文件,建立起含有上述3列信息的拼音词典文件后,保存为后缀名为 txt 或 lib 的字典文件,就可以在谷歌拼音的设置面板中导入。如果导入过程弹出警告,部分拒绝或全部拒绝刚才自己编写的默认词典,一般原因有这些:

  1. 第一列出现了非汉字字符;
  2. 第三列音节数错误。

其实上面的问题已经在谷歌帮助文件说得很清楚。一般情况下,没有人会用拼音输出一些特别的标点符号,而且谷歌拼音自身就拒绝拼音具备这一功能。反而第二种错误容易受大家忽视,而且不太好查出原因。大家看了下面的例子就会明白了:

某人姓名的拼音为:

Xi Jinping
Xi Jin Ping


问题就出现在这里,谷歌拼音输入按照每个音节辨认而且对应字符串,而第一种将名字并列在一起的做法虽然得到翻译公认,却不能成为拼音的标准。Google 这样做自有它的道理,不过习惯了复姓的我们还真的不留意,看见司马、欧阳、上官这些姓氏和复名很自然地就联想到在 Sima、Ouyang、Shangguan 拼音,没有意识到拆开 si ma、ou yang、shang guan 并建立词典。

有了这些经验,我建立了一个使用频率最高的 Google Pinyin 自定义默认词典,将人力资源管理几乎天天使用的 95 位同事姓名建立到电子表格,并放在云储存服务器。这样每次重置词典后第一件事就是把这份词典导入到谷歌拼音输入法中。

Comments

TOP