关于取词的一些常见问题

软件: 《新编全医药学大词典》2008-2011

问题: 关于取词的一些常见问题

问题:
对文本文件中的内容取词时,是错误的,即取出来的词好像是乱码?
原因:
这是因为这些文件中中文字符用的是西方字体,编码是unicode的原因。
解决方法:
将文件另存为ansi格式,然后将字体改为宋体即可。

问题:
在pdf中取词时有的词连在了一起。
原因:
这些pdf文件制作时格式比较特殊,两个词之间的空格和正常的不太一样。
解决方法:
将pdf文件放大一些浏览,如放大为150%或以上即可。

问题:
不能在caj文件中取词。
原因:
Caj7.0版以前本身就不支持任何翻译,也没有提供接口。
解决方法:
安装caj7.0版,并在工具->参数设置中选中允许屏幕取词即可。
注意:1,caj文件本身对翻译软件支持的不好,可能会有翻译错位现象,任何翻译软件都有该现象;2,要翻译的文件一定不是图片才能取词。