代码之家  ›  专栏  ›  技术社区  ›  bsteo

Python re.sub(),带有Unicode表达式词典[重复]

  •  -2
  • bsteo  · 技术社区  · 2 年前

    我有以下Unicode叙利亚文文本:

    1 ܟܰܕܼ ܕܶܝܢ ܐܶܬܼܺܝܠܶܕܼ ܝܶܫܽܘܥ ܒܒܼܶܝܬܼ ܠܚܶܡ ܕܺܝܗܽܘܕܼܳܐ܃ ܒܝܰܘܡܰܝ̈ ܗܶܪܳܘܕܼܶܣ ܡܰܠܟܿܳܐ܃ ܐܶܬܼܰܘ ܡܓܼܽܘܫܶܐ̈ ܡܶܢ ܡܰܕܼܢܚܳܐ ܠܽܐܘܪܺܫܠܶܡ܂
    2 ܘܳܐܡܪܺܝܢ܂ ܐܰܝܟܿܰܘ ܡܰܠܟܿܳܐ ܕܺܝܗܽܘܕܼܳܝܶܐ̈ ܕܶܐܬܼܺܝܠܶܕܼ܂ ܚܙܰܝܢ ܓܶܝܪ ܟܰܘܟܿܒܼܶܗ ܒܡܰܕܼܢܚܳܐ܃ ܘܶܐܬܼܰܝܢ ܠܡܶܣܓܿܰܕܼ ܠܶܗ܂
    3 ܫܡܰܥ ܕܶܝܢ ܗܶܪܳܘܕܼܶܣ ܡܰܠܟܿܳܐ܂ ܘܶܐܬܿܬܿܙܺܝܥ܃ ܘܟܼܽܠܳܗ ܐܽܘܪܺܫܠܶܡ ܥܰܡܶܗ܂
    4 ܘܟܼܰܢܶܫ ܟܽܠܗܽܘܢ ܪ̈ܰܒܰܝ ܟܳܗܢܶܐ̈ ܘܣܳܦܼܪ̈ܶܐ ܕܥܰܡܳܐ܃ ܘܰܡܫܰܐܶܠ ܗ̱ܘܳܐ ܠܗܽܘܢ܂ ܕܰܐܝܟܿܳܐ ܡܶܬܼܺܝܠܶܕܼ ܡܫܺܝܚܳܐ܀
    5 ܗܶܢܽܘܢ ܕܶܝܢ ܐܶܡܰܪܘ܂ ܒܒܼܶܝܬܼ ܠܚܶܡ ܕܺܝܗܽܘܕܼܳܐ܂ ܗܳܟܼܰܢܳܐ ܓܶܝܪ ܟܬܼܺܝܒܼ ܒܰܢܒܼܺܝܳܐ܂
    6 ܐܳܦܼ ܐܰܢ̱ܬܿܝ ܒܶܝܬܼ ܠܚܶܡ ܕܺܝܗܽܘܕܼܳܐ܃ ܠܳܐ ܗܘܰܝܬܿܝ ܒܨܺܝܪܳܐ ܒܡܰܠܟܿܶܐ̈ ܕܺܝܗܽܘܕܼܳܐ܂ ܡܶܢܶܟܼܝ ܓܶܝܪ ܢܶܦܽܘܩ ܡܰܠܟܿܳܐ܃ ܕܗܽܘ ܢܶܪܥܶܝܘܗ̱ܝ ܠܥܰܡܝ ܐܺܝܣܪܳܐܝܶܠ܀
    7 ܗܳܝܕܶܝܢ ܗܶܪܳܘܕܼܶܣ ܡܰܛܫܝܳܐܺܝܬܼ ܩܪܳܐ ܠܰܡܓܼܽܘܫܶܐ̈܃ ܘܺܝܠܶܦܼ ܡܶܢܗܽܘܢ ܒܰܐܝܢܳܐ ܙܰܒܼܢܳܐ ܐܶܬܼܚܙܺܝ ܠܗܽܘܢ ܟܰܘܟܿܒܼܳܐ܂
    8 ܘܫܰܕܿܰܪ ܐܶܢܽܘܢ ܠܒܼܶܝܬܼ ܠܚܶܡ܂ ܘܶܐܡܰܪ ܠܗܽܘܢ܂ ܙܶܠܘ ܥܰܩܶܒܼܘ܂ ܥܰܠ ܛܰܠܝܳܐ܂ ܚܦܼܺܝܛܳܐܺܝܬܼ܂ ܘܡܳܐ ܕܶܐܫܟܿܰܚܬܿܽܘܢܳܝܗ̱ܝ܂ ܬܰܘ ܚܰܘܰܐܘܽܢܝ܂ ܕܳܐܦܼ ܐܶܢܳܐ ܐܺܙܰܠ ܐܶܣܓܿܽܘܕܼ ܠܶܗ܂
    9 ܗܶܢܽܘܢ ܕܶܝܢ ܟܰܕܼ ܫܡܰܥܘ ܡܶܢ ܡܰܠܟܿܳܐ ܐܶܙܰܠܘ܂ ܘܗܳܐ ܟܰܘܟܿܒܼܳܐ ܗܰܘ ܕܰܚܙܰܘ ܒܡܰܕܼܢܚܳܐ ܐܳܙܶܠ ܗ̱ܘܳܐ ܩܕܼܳܡܰܝܗܽܘܢ܃ ܥܕܼܰܡܳܐ ܕܶܐܬܼܳܐ ܩܳܡ ܠܥܶܠ ܡܶܢ ܐܰܝܟܿܳܐ ܕܺܐܝܬܼܰܘܗ̱ܝ ܛܰܠܝܳܐ܂
    

    我想要这样的东西:

    1 ܟ݁ܰܕ݁ ܕ݁ܶܝܢ ܐܶܬ݂ܺܝܠܶܕ݂ ܝܶܫܽܘܥ ܒ݁ܒ݂ܶܝܬ݂ ܠܚܶܡ ܕ݁ܺܝܗܽܘܕ݂ܳܐ܃ ܒ݁ܝܰܘܡܰܝ̈ ܗܶܪܳܘܕ݂ܶܣ ܡܰܠܟ݁ܳܐ܃ ܐܶܬ݂ܰܘ ܡܓ݂ܽܘܫܶܐ̈ ܡܶܢ ܡܰܕ݂ܢܚܳܐ ܠܽܐܘܪܺܫܠܶܡ܂
    2 ܘܳܐܡܪܺܝܢ܂ ܐܰܝܟ݁ܰܘ ܡܰܠܟ݁ܳܐ ܕ݂ܺܝܗܽܘܕ݂ܳܝܳܐ̈ ܕ݂ܶܐܬ݂ܺܝܠܶܕ݂܂ ܚܙܰܝܢ ܓ݁ܶܝܪ ܟ݁ܰܘܟ݁ܒ݂ܶܗ ܒ݁ܡܰܕ݂ܢܚܳܐ܃ ܘܶܐܬ݂ܰܝܢ ܠܡܶܣܓ݁ܰܕ݂ ܠܶܗ܂
    3 ܫܡܰܥ ܕ݁ܶܝܢ ܗܶܪܳܘܕ݂ܶܣ ܡܰܠܟ݁ܳܐ܂ ܘܶܐܬ݁ܬ݁ܙܺܝܥ܃ ܘܟ݂ܽܠܳܗ ܐܽܘܪܺܫܠܶܡ ܥܰܡܶܗ܂
    4 ܘܟ݂ܰܢܶܫ ܟ݁ܽܠܗܽܘܢ ܪ̈ܰܒܰܝ ܟ݁ܳܗܢܶܐ̈ ܘܣܳܦ݂ܪ̈ܳܐ ܕ݂ܥܰܡܳܐ܃ ܘܰܡܫܰܐܶܠ ܗ̱ܘܳܐ ܠܗܽܘܢ܂ ܕ݁ܰܐܝܟ݁ܳܐ ܡܶܬ݂ܺܝܠܶܕ݂ ܡܫܺܝܚܳܐ܀
    5 ܗܶܢܽܘܢ ܕ݁ܶܝܢ ܐܶܡܰܪܘ܂ ܒ݁ܒ݂ܶܝܬ݂ ܠܚܶܡ ܕ݁ܺܝܗܽܘܕ݂ܳܐ܂ ܗܳܟ݂ܰܢܳܐ ܓ݂ܶܝܪ ܟ݁ܬ݂ܺܝܒ݁ ܒ݁ܰܢܒ݂ܺܝܳܐ܂
    6 ܐܳܦ݂ ܐܰܢ̱ܬ݁ܝ ܒ݁ܶܝܬ݂ ܠܚܶܡ ܕ݁ܺܝܗܽܘܕ݂ܳܐ܃ ܠܳܐ ܗܘܰܝܬ݁ܝ ܒ݁ܨܺܝܪܳܐ ܒ݂ܡܰܠܟ݁ܳܐ̈ ܕ݂ܺܝܗܽܘܕ݂ܳܐ܂ ܡܶܢܶܟ݂ܝ ܓ݁ܶܝܪ ܢܶܦܽܘܩ ܡܰܠܟ݁ܳܐ܃ ܕ݁ܗܽܘ ܢܶܪܥܶܝܘܗ̱ܝ ܠܥܰܡܝ ܐܺܝܣܪܳܐܝܶܠ܀
    7 ܗܳܝܕܶܝܢ ܗܶܪܳܘܕ݂ܶܣ ܡܰܛܫܝܳܐܺܝܬ݂ ܩܪܳܐ ܠܰܡܓ݂ܽܘܫܶܐ̈܃ ܘܺܝܠܶܦ݂ ܡܶܢܗܽܘܢ ܒ݁ܰܐܝܢܳܐ ܙܰܒ݂ܢܳܐ ܐܶܬ݂ܚܙܺܝ ܠܗܽܘܢ ܟ݁ܰܘܟ݁ܒ݂ܳܐ܂
    8 ܘܫܰܕ݁ܰܪ ܐܶܢܽܘܢ ܠܒ݂ܶܝܬ݂ ܠܚܶܡ܂ ܘܶܐܡܰܪ ܠܗܽܘܢ܂ ܙܶܠܘ ܥܰܩܶܒ݂ܘ܂ ܥܰܠ ܛܰܠܝܳܐ܂ ܚܦ݂ܺܝܛܳܐܺܝܬ݂܂ ܘܡܳܐ ܕ݂ܶܐܫܟ݁ܰܚܬ݁ܽܘܢܳܝܗ̱ܝ܂ ܬ݁ܰܘ ܚܰܘܰܐܘܽܢܝ܂ ܕ݁ܳܐܦ݂ ܐܶܢܳܐ ܐܺܙܰܠ ܐܶܣܓ݁ܽܘܕ݂ ܠܶܗ܂
    9 ܗܶܢܽܘܢ ܕ݁ܶܝܢ ܟ݁ܰܕ݂ ܫܡܰܥܘ ܡܶܢ ܡܰܠܟ݁ܳܐ ܐܶܙܰܠܘ܂ ܘܗܳܐ ܟ݂ܰܘܟ݁ܒ݂ܳܐ ܗܰܘ ܕ݁ܰܚܙܰܘ ܒ݁ܡܰܕ݂ܢܚܳܐ ܐܳܙܶܠ ܗ̱ܘܳܐ ܩܕ݂ܳܡܰܝܗܽܘܢ܃ ܥܕ݂ܰܡܳܐ ܕ݂ܶܐܬ݂ܳܐ ܩܳܡ ܠܥܶܠ ܡܶܢ ܐܰܝܟ݁ܳܐ ܕ݂ܺܐܝܬ݂ܰܘܗ̱ܝ ܛܰܠܝܳܐ܂
    10 ܟ݁ܰܕ݁ ܕ݁ܶܝܢ ܚܙܰܐܘܽܗ̱ܝ ܠܟ݂ܰܘܟ݁ܒ݂ܳܐ܂ ܚܕ݂ܺܝܘ ܚܰܕ݂ܽܘܬ݂ܳܐ ܪܰܒ݁ܬ݂ܳܐ ܕ݂ܛܳܒ݂܂
    

    基本上随着一些规则的改变 \u073F \u0741 并添加 \u0741 \u0742 在文本中没有它们的地方。我取得了一个成功的结果,但字典太长了,有些短语重复,所以我试着用 \1 \2 没有执行。

    分组的结果(这很糟糕):

    1 ݂݁ܰ ݁ܶܝܢ ܐ݂ܶܺܝܠ݂ܶ ܝܶܫܽܘܥ ݂݁ܶܝ݂ ܠܚܶܡ ݁ܺܝܗܽܘ݂ܳܐ܃ ݁ܝܰܘܡܰܝ̈ ܗܶܪܳܘ݂ܶܣ ܡܰܠ݁ܳܐ܃ ܐ݂ܶܰܘ ܡ݂ܽܘܫܶܐ̈ ܡܶܢ ܡ݂ܰܢܚܳܐ ܠܽܐܘܪܺܫܠܶܡ܂
    2 ܘܳܐܡܪܺܝܢ܂ ܐܰܝ݁ܰܘ ܡܰܠ݁ܳܐ ݁ܺܝܗܽܘ݂ܳܝܶܐ̈ ݁ܶܐ݂ܺܝܠ݂ܶ܂ ܚܙܰܝܢ ݁ܶܝܪ ݁ܰܘ݂݁ܶܗ ݁ܡ݂ܰܢܚܳܐ܃ ܘܶܐ݂ܰܝܢ ܠܡܶܣ݂݁ܰ ܠܶܗ܂
    3 ܫܡܰܥ ݁ܶܝܢ ܗܶܪܳܘ݂ܶܣ ܡܰܠ݁ܳܐ܂ ܘܶܐ݁݁ܙܺܝܥ܃ ܘ݂ܽܠܳܗ ܐܽܘܪܺܫܠܶܡ ܥܰܡܶܗ܂
    4 ܘ݂ܰܢܶܫ ݁ܽܠܗܽܘܢ ܪ̈ܰܒܰܝ ݁ܳܗܢܶܐ̈ ܘܣ݂ܳܪ̈ܶܐ ݁ܥܰܡܳܐ܃ ܘܰܡܫܰܐܶܠ ܗ̱ܘܳܐ ܠܗܽܘܢ܂ ݁ܰܐܝ݁ܳܐ ܡ݂ܶܺܝܠ݂ܶ ܡܫܺܝܚܳܐ܀
    5 ܗܶܢܽܘܢ ݁ܶܝܢ ܐܶܡܰܪܘ܂ ݂݁ܶܝ݂ ܠܚܶܡ ݁ܺܝܗܽܘ݂ܳܐ܂ ܗ݂ܳܰܢܳܐ ݁ܶܝܪ ݂݁ܺܝ݂ ݁ܰܢ݂ܺܝܳܐ܂
    6 ܐ݂ܳ ܐܰܢ̱݁ܝ ݁ܶܝ݂ ܠܚܶܡ ݁ܺܝܗܽܘ݂ܳܐ܃ ܠܳܐ ܗܘܰܝ݁ܝ ݁ܨܺܝܪܳܐ ݁ܡܰܠ݁ܶܐ̈ ݁ܺܝܗܽܘ݂ܳܐ܂ ܡܶܢ݂ܶܝ ݁ܶܝܪ ܢܶܦܽܘܩ ܡܰܠ݁ܳܐ܃ ݁ܗܽܘ ܢܶܪܥܶܝܘܗ̱ܝ ܠܥܰܡܝ ܐܺܝܣܪܳܐܝܶܠ܀
    7 ܗܳܝܕܶܝܢ ܗܶܪܳܘ݂ܶܣ ܡܰܛܫܝܳܐܺܝ݂ ܩܪܳܐ ܠܰܡ݂ܽܘܫܶܐ̈܃ ܘܺܝܠ݂ܶ ܡܶܢܗܽܘܢ ݁ܰܐܝܢܳܐ ܙ݂ܰܢܳܐ ܐ݂ܶܚܙܺܝ ܠܗܽܘܢ ݁ܰܘ݂݁ܳܐ܂
    8 ܘܫܰ݁ܰܪ ܐܶܢܽܘܢ ܠ݂ܶܝ݂ ܠܚܶܡ܂ ܘܶܐܡܰܪ ܠܗܽܘܢ܂ ܙܶܠܘ ܥܰܩ݂ܶܘ܂ ܥܰܠ ܛܰܠܝܳܐ܂ ܚ݂ܺܝܛܳܐܺܝ݂܂ ܘܡܳܐ ݁ܶܐܫ݁ܰܚ݁ܽܘܢܳܝܗ̱ܝ܂ ݁ܰܘ ܚܰܘܰܐܘܽܢܝ܂ ݁ܳܐ݂ ܐܶܢܳܐ ܐܺܙܰܠ ܐܶܣ݁ܽܘ݂ ܠܶܗ܂
    9 ܗܶܢܽܘܢ ݁ܶܝܢ ݂݁ܰ ܫܡܰܥܘ ܡܶܢ ܡܰܠ݁ܳܐ ܐܶܙܰܠܘ܂ ܘܗܳܐ ݁ܰܘ݂݁ܳܐ ܗܰܘ ݁ܰܚܙܰܘ ݁ܡ݂ܰܢܚܳܐ ܐܳܙܶܠ ܗ̱ܘܳܐ ܩ݂ܳܡܰܝܗܽܘܢ܃ ܥ݂ܰܡܳܐ ݁ܶܐ݂ܳܐ ܩܳܡ ܠܥܶܠ ܡܶܢ ܐܰܝ݁ܳܐ ݁ܺܐܝ݂ܰܘܗ̱ܝ ܛܰܠܝܳܐ܂
    10 ݂݁ܰ ݁ܶܝܢ ܚܙܰܐܘܽܗ̱ܝ ܠ݂ܰܘ݂݁ܳܐ܂ ܚ݂ܺܝܘ ܚ݂ܰܽܘ݂ܳܐ ܪ݂ܰ݁ܳܐ ݁ܛ݂ܳ܂
    

    我的代码:

    #!/usr/bin/env python3
    # coding=utf8
    
    import re
    
    syr_unicodes_dict = {
            '([\u0712\u0713\u0715\u071F\u0726\u072C]{1})\u073F': '\1\u0741',
            '([\u0712\u0713\u0715\u071F\u0726\u072C]{1})\u073C': '\1\u0742',
            '^([\u0712\u0713\u0715\u071F\u0726\u072C]{1})': '\1\u0741',
            ' ([\u0712\u0713\u0715\u071F\u0726\u072C]{1})': ' \1\u0741',
            '([\u0730-\u073B]{1}\u0710\u0020[\u0712\u0713\u0715\u071F\u0726\u072C]{1})\u0741': '\1\u0742',
            '([\u073E\u073D]{1}\u0718\u0020[\u0712\u0713\u0715\u071F\u0726\u072C]{1})\u0741': '\1\u0742',
            '([\u0730-\u073B]{1}\u0710\u0308\u0020[\u0712\u0713\u0715\u071F\u0726\u072C]{1})\u0741': '\1\u0742',
            '\u0712\u0742\u0020\u0712\u0741': '\u0712\u0741\u0020\u0712\u0741',
            '\u0713\u0742\u0020\u0713\u0741': '\u0713\u0741\u0020\u0713\u0741',
            '\u0715\u0742\u0020\u0715\u0741': '\u0715\u0741\u0020\u0715\u0741',
            '\u071F\u0742\u0020\u071F\u0741': '\u071F\u0741\u0020\u071F\u0741',
            '\u0726\u0742\u0020\u0726\u0741': '\u0726\u0741\u0020\u0726\u0741',
            '\u072C\u0742\u0020\u072C\u0741': '\u072C\u0741\u0020\u072C\u0741',
            '\u072C\u0742\u0020\u0715\u0741': '\u072C\u0741\u0020\u0715\u0741',
            '\u0715\u0742\u0020\u072C\u0741': '\u0715\u0741\u0020\u072C\u0741',
            '\u0712\u0742\u0020\u0726\u0741': '\u0712\u0741\u0020\u0726\u0741',
            '\u0713\u0742\u0020\u071F\u0741': '\u0713\u0741\u0020\u071F\u0741',
            '\u071F\u0742\u0020\u0713\u0741': '\u071F\u0741\u0020\u0713\u0741',
            '\u0741\u0741': '\u0741',
            '\u0742\u0742': '\u0742'
    }
    
    print('length of Syriac_unicodes_dict is ' + str(len(syr_unicodes_dict)))
    
    text_file = open('./matthew.txt', 'r', encoding = 'utf-8')
    revised_text_file = open('./matthew_fixed.txt', 'w')
    
    with text_file, revised_text_file:
        for line in text_file:
            for old_value, new_value in (syr_unicodes_dict.items()):
                #new_line = re.sub(r''+old_value+'', r''+new_value+'', line, 1)
                old_value = re.compile(r''+old_value+'')
                #new_value = re.compile(r''+new_value+'') # error don't know why. `TypeError: decoding to str: need a bytes-like object, _sre.SRE_Pattern found`
                new_line = re.sub(old_value, r''+new_value+'', line, re.UNICODE)
                #new_line = re.sub(r''+old_value+'', r''+new_value+'', line, re.UNICODE)
                line = new_line
            revised_text_file.write(new_line)
    
    1 回复  |  直到 2 年前
        1
  •  0
  •   Barmar    2 年前

    对正则表达式使用原始字符串。在替换中,您需要转义中的反斜杠 \1 .

    没必要打电话 re.compile() 对于只使用一次的regexp。您可以直接将字符串传递给 re.sub() .

    #!/usr/bin/env python3
    # coding=utf8
    
    import re
    
    syr_unicodes_dict = {
            r'([\u0712\u0713\u0715\u071F\u0726\u072C])\u073F': '\\1\u0741',
            r'([\u0712\u0713\u0715\u071F\u0726\u072C])\u073C': '\\1\u0742',
            r'^([\u0712\u0713\u0715\u071F\u0726\u072C])': '\\1\u0741',
            r' ([\u0712\u0713\u0715\u071F\u0726\u072C])': ' \\1\u0741',
            r'([\u0730-\u073B]\u0710\u0020[\u0712\u0713\u0715\u071F\u0726\u072C])\u0741': '\\1\u0742',
            r'([\u073E\u073D]\u0718\u0020[\u0712\u0713\u0715\u071F\u0726\u072C])\u0741': '\\1\u0742',
            r'([\u0730-\u073B]\u0710\u0308\u0020[\u0712\u0713\u0715\u071F\u0726\u072C])\u0741': '\\1\u0742',
            r'\u0712\u0742\u0020\u0712\u0741': '\u0712\u0741\u0020\u0712\u0741',
            r'\u0713\u0742\u0020\u0713\u0741': '\u0713\u0741\u0020\u0713\u0741',
            r'\u0715\u0742\u0020\u0715\u0741': '\u0715\u0741\u0020\u0715\u0741',
            r'\u071F\u0742\u0020\u071F\u0741': '\u071F\u0741\u0020\u071F\u0741',
            r'\u0726\u0742\u0020\u0726\u0741': '\u0726\u0741\u0020\u0726\u0741',
            r'\u072C\u0742\u0020\u072C\u0741': '\u072C\u0741\u0020\u072C\u0741',
            r'\u072C\u0742\u0020\u0715\u0741': '\u072C\u0741\u0020\u0715\u0741',
            r'\u0715\u0742\u0020\u072C\u0741': '\u0715\u0741\u0020\u072C\u0741',
            r'\u0712\u0742\u0020\u0726\u0741': '\u0712\u0741\u0020\u0726\u0741',
            r'\u0713\u0742\u0020\u071F\u0741': '\u0713\u0741\u0020\u071F\u0741',
            r'\u071F\u0742\u0020\u0713\u0741': '\u071F\u0741\u0020\u0713\u0741',
            r'\u0741\u0741': '\u0741',
            r'\u0742\u0742': '\u0742'
    }
    
    print('length of Syriac_unicodes_dict is ' + str(len(syr_unicodes_dict)))
    
    text_file = open('./matthew.txt', 'r', encoding = 'utf-8')
    revised_text_file = open('./matthew_fixed.txt', 'w')
    
    with text_file, revised_text_file:
        for line in text_file:
            for old_value, new_value in (syr_unicodes_dict.items()):
                new_line = re.sub(old_value, new_value, line, re.UNICODE)
                line = new_line
            revised_text_file.write(new_line)
    

    没有必要使用 {1} 在正则表达式中。除非另有量化,否则子模式只匹配1次。

    我得到的输出是:

    1 ܟ݁ܰܕ݁ ܕ݁ܶܝܢ ܐܶܬ݂ܺܝܠܶܕ݂ ܝܶܫܽܘܥ ܒ݁ܒ݂ܶܝܬ݂ ܠܚܶܡ ܕ݁ܺܝܗܽܘܕ݂ܳܐ܃ ܒ݁ܝܰܘܡܰܝ̈ ܗܶܪܳܘܕ݂ܶܣ ܡܰܠܟ݁ܳܐ܃ ܐܶܬ݂ܰܘ ܡܓ݂ܽܘܫܶܐ̈ ܡܶܢ ܡܰܕ݂ܢܚܳܐ ܠܽܐܘܪܺܫܠܶܡ܂
    2 ܘܳܐܡܪܺܝܢ܂ ܐܰܝܟ݁ܰܘ ܡܰܠܟ݁ܳܐ ܕ݂ܺܝܗܽܘܕ݂ܳܝܶܐ̈ ܕ݂ܶܐܬ݂ܺܝܠܶܕ݂܂ ܚܙܰܝܢ ܓ݁ܶܝܪ ܟ݁ܰܘܟ݁ܒ݂ܶܗ ܒ݁ܡܰܕ݂ܢܚܳܐ܃ ܘܶܐܬ݂ܰܝܢ ܠܡܶܣܓ݁ܰܕ݂ ܠܶܗ܂
    3 ܫܡܰܥ ܕ݁ܶܝܢ ܗܶܪܳܘܕ݂ܶܣ ܡܰܠܟ݁ܳܐ܂ ܘܶܐܬ݁ܬ݁ܙܺܝܥ܃ ܘܟ݂ܽܠܳܗ ܐܽܘܪܺܫܠܶܡ ܥܰܡܶܗ܂
    4 ܘܟ݂ܰܢܶܫ ܟ݁ܽܠܗܽܘܢ ܪ̈ܰܒܰܝ ܟ݁ܳܗܢܶܐ̈ ܘܣܳܦ݂ܪ̈ܶܐ ܕ݂ܥܰܡܳܐ܃ ܘܰܡܫܰܐܶܠ ܗ̱ܘܳܐ ܠܗܽܘܢ܂ ܕ݁ܰܐܝܟ݁ܳܐ ܡܶܬ݂ܺܝܠܶܕ݂ ܡܫܺܝܚܳܐ܀
    5 ܗܶܢܽܘܢ ܕ݁ܶܝܢ ܐܶܡܰܪܘ܂ ܒ݁ܒ݂ܶܝܬ݂ ܠܚܶܡ ܕ݁ܺܝܗܽܘܕ݂ܳܐ܂ ܗܳܟ݂ܰܢܳܐ ܓ݂ܶܝܪ ܟ݁ܬ݂ܺܝܒ݁ ܒ݁ܰܢܒ݂ܺܝܳܐ܂
    6 ܐܳܦ݂ ܐܰܢ̱ܬ݁ܝ ܒ݁ܶܝܬ݂ ܠܚܶܡ ܕ݁ܺܝܗܽܘܕ݂ܳܐ܃ ܠܳܐ ܗܘܰܝܬ݁ܝ ܒ݁ܨܺܝܪܳܐ ܒ݂ܡܰܠܟ݁ܶܐ̈ ܕ݂ܺܝܗܽܘܕ݂ܳܐ܂ ܡܶܢܶܟ݂ܝ ܓ݁ܶܝܪ ܢܶܦܽܘܩ ܡܰܠܟ݁ܳܐ܃ ܕ݁ܗܽܘ ܢܶܪܥܶܝܘܗ̱ܝ ܠܥܰܡܝ ܐܺܝܣܪܳܐܝܶܠ܀
    7 ܗܳܝܕܶܝܢ ܗܶܪܳܘܕ݂ܶܣ ܡܰܛܫܝܳܐܺܝܬ݂ ܩܪܳܐ ܠܰܡܓ݂ܽܘܫܶܐ̈܃ ܘܺܝܠܶܦ݂ ܡܶܢܗܽܘܢ ܒ݁ܰܐܝܢܳܐ ܙܰܒ݂ܢܳܐ ܐܶܬ݂ܚܙܺܝ ܠܗܽܘܢ ܟ݁ܰܘܟ݁ܒ݂ܳܐ܂
    8 ܘܫܰܕ݁ܰܪ ܐܶܢܽܘܢ ܠܒ݂ܶܝܬ݂ ܠܚܶܡ܂ ܘܶܐܡܰܪ ܠܗܽܘܢ܂ ܙܶܠܘ ܥܰܩܶܒ݂ܘ܂ ܥܰܠ ܛܰܠܝܳܐ܂ ܚܦ݂ܺܝܛܳܐܺܝܬ݂܂ ܘܡܳܐ ܕ݂ܶܐܫܟ݁ܰܚܬ݁ܽܘܢܳܝܗ̱ܝ܂ ܬ݁ܰܘ ܚܰܘܰܐܘܽܢܝ܂ ܕ݁ܳܐܦ݂ ܐܶܢܳܐ ܐܺܙܰܠ ܐܶܣܓ݁ܽܘܕ݂ ܠܶܗ܂
    9 ܗܶܢܽܘܢ ܕ݁ܶܝܢ ܟ݁ܰܕ݂ ܫܡܰܥܘ ܡܶܢ ܡܰܠܟ݁ܳܐ ܐܶܙܰܠܘ܂ ܘܗܳܐ ܟ݂ܰܘܟ݁ܒ݂ܳܐ ܗܰܘ ܕ݁ܰܚܙܰܘ ܒ݁ܡܰܕ݂ܢܚܳܐ ܐܳܙܶܠ ܗ̱ܘܳܐ ܩܕ݂ܳܡܰܝܗܽܘܢ܃ ܥܕ݂ܰܡܳܐ ܕ݂ܶܐܬ݂ܳܐ ܩܳܡ ܠܥܶܠ ܡܶܢ ܐܰܝܟ݁ܳܐ ܕ݂ܺܐܝܬ݂ܰܘܗ̱ܝ ܛܰܠܝܳܐ܂
    

    我不懂叙利亚文,所以我不知道它是否正确,但它没有任何文字 \u 序列。