![]() |
1
4
除了你问的问题,你还有一些问题。 (1)概念问题:“e-k-b-u-d-z*dhi-m-aan-p-ksii”是 不 “英语”。它是一种印地语,使用某种罗马化方案以ASCII码书写。看起来像iTrans,但iTrans没有AA和A,只有AA和A。这个计划有名字吗?你能提供一个网址吗?您的对象更好地描述为“将一些印地语文本从未命名的罗马化翻译为天成文书(devanagari)脚本”。 (2)显示将文本从印地语翻译成英语的结果(“聪明的老鸟”等)只是中等程度的有用。预计天成文书输出将是一个更好的主意。
(3)如@kaiser.se所述,音译字典有多个字节(最多3个字节!)键,其中一些是其他键的前缀。想必
(4)要么字典缺少一些字母键(a s t z),要么音译规则比我们迄今所猜测的更复杂。 (5)字符*和-的含义并非100%明显。从输入文本中,Z和*仅以Z的形式组合出现。*
(6)如果你解释了例如
当然,对于您询问的问题的答案是,正如其他一些人指出的那样,您需要使用显示设备(如UTF-8)支持的编码对Unicode输出进行编码。 下面是一些代码:
输出: _ _ 224; 224; 224; \ 224; \224; \224; 224; A _ _ _ _ _ tz T__ _ Z_ 224; 224; 224; \ \ 224__ ___________________ _·_·_·_·_·_·_·_·_·_·_·_·_·_·_·_·_·_·_·_·_·T_·_·A वॠसब यहà¥à¤ सà¥à¤°à¤à¥à¤·à¤¿t तॠà¥à¤° बडॠठरà¥à¤® सॠरहtॠतॠ____________________ _¨_¨_¨_¨_¨_¨A _______ धिमà¥à¤¨ पà¤à¥à¤·à¥ नॠà¤à¤ दिन पà¥à¤¡ à¤à¥ à¤à¤¡ मà¥à¤¨à¤ सॠà¤à¤ लtॠà¤à¥ ठà¤tॠदà¥à¤à¥ à¤à¤¸ à¤à¥ बà¥à¤°à¥ मà¥à¤¨à¤ ठसनॠदà¥à¤¸à¤°à¥ पà¤à¥à¤·à¤¿à¤¯à¥à¤¨à¤ सॠबà¥t à¤à¥ “_ Z _ _ t_ z हà¥à¤¨à¤ वह लtॠदिà¤à¥à¤ दà¥tॠहà¥à¤¿", ठस नॠठन सॠपà¥à¤à¥ "tà¥à¤®z _____________垎 _ _ _ _ _ _ _ _ _ _” “_ _ _ _ Z ____ _¨s_垎 _ _ _ _ _ _ _ _ _ _??______________ 阿尔法 _ 224; 224; 224;? _____224;_224;_______ _________________ “_?_?_?_?_?_?_?_?_?_?_?_?_?_?_?_?_?_?_?_?Z _¨_¨_¨_¨_¨_¨_¨_¨_¨_¨_¨_¨_¨_ tz T________________ _______________ _______ ________ _ 224; 224; 224; 224; \224; 224; Z_ T_ _ _ _ _” “T Z “舒适” 在谷歌翻译的过程中,只有几个可识别的词。 更新 仔细检查音译表后:
天成文书(梵文)字母Xa由x表示
但是有3个条目破坏了模式:
注意:更改上面的3个条目使我的代码不再抱怨在翻译示例文本时s和t保持不变,并删除了看起来异常的sha和tha条目。
|
![]() |
2
1
|
![]() |
3
1
确实要删除所有连字符(-)吗?查看您的输入文件,看起来所有替换的内容都是两个或三个字符的代码,例如u'i-':u''。如果是这样,您可以执行如下操作,但请确保对字典中的所有键和值使用Unicode字符串:
根据这个理论,我得到了下面的结果,它看起来像是字典中缺少了“z*”、“t-”、“ng”和“ei”等翻译。我不读印地语,但谷歌翻译公司在你的翻译中发现了一些英文单词,所以我认为我走对了。
|