URI: 
       tUpdate data files - transliterate_data - Data for Urdu<->Hindi transliteration
  HTML git clone git://lumidify.org/transliterate_data.git
   DIR Log
   DIR Files
   DIR Refs
   DIR README
       ---
   DIR commit b01c2c622f6531dfec33d849cd18969727e56ff2
   DIR parent 0134ecc2e136b2c595ac166995590a73ac7f20e9
  HTML Author: lumidify <nobody@lumidify.org>
       Date:   Sun,  5 Apr 2020 15:28:09 +0200
       
       Update data files
       
       Diffstat:
         A ExplanationForAdditionalFilesInHin… |      12 ++++++++++++
         M config.hi_ur                        |      41 ++++++++++++++++++++++---------
         M config.ur_hi                        |       1 -
         D data/be.hi_ur.txt                   |      19 -------------------
         M data/nouns_adjectives/ahmasc.txt    |       3 ++-
         M data/nouns_adjectives/cfem.txt      |       7 +++++--
         M data/nouns_adjectives/cmasc.txt     |      11 +++++------
         M data/nouns_adjectives/ifem.txt      |       6 +++---
         M data/nouns_adjectives/irregular.txt |      44 +++++++++++++++++++------------
         M data/nouns_adjectives/o_a_staysfem… |       1 +
         A data/pairs.hi_ur.txt                |       8 ++++++++
         M data/special.hi_ur.txt              |       3 +--
         M data/special.ur_hi.txt              |       1 -
         M data/verbs/irregular.txt            |       2 ++
         M data/verbs/regular_consonant_endin… |       4 ++--
         M data/verbs/regular_ending_in_a_o.t… |       2 --
       
       16 files changed, 98 insertions(+), 67 deletions(-)
       ---
   DIR diff --git a/ExplanationForAdditionalFilesInHindiUrduTransliteration b/ExplanationForAdditionalFilesInHindiUrduTransliteration
       t@@ -0,0 +1,12 @@
       +In the HindiToUrdu transliteration,the order of tables has been rearranged in the list and a new table 'pairs.hi_ur' has been added.
       +
       +One problem is the بے, which is converted to बे. When converting back, the program cannot recognize if it is a بے  as in بےشک (बेशक)or بی as in بیٹا (बेटा).
       +
       +Therefore misc_beginword.hi_ur.txt containing the بے replacement has been shifted to after replacement of the group of tables comprising of adjective_nouns and verbs.
       +
       +However, now it unable to find words such as बेशक; although शक is in the nouns_adjectives/cmasc.txt file, it is not recognized because it begins with बे.
       +
       +Another problematic rule is the Persian Genetive े-  (मुल्के-मिसर), which conflicts with word pairs containing this such as नवासे-नवासियाँ. These word pairs are regular inflections and do not contain a Persian Genetive, so in Urdu script the first word of the pair ends in ے + space and not ِ  + space.
       +
       +Therefore word pairs conflicting with the Persian Genetive have been put into the new file 'pairs.hi_ur'.
       +
   DIR diff --git a/config.hi_ur b/config.hi_ur
       t@@ -8,7 +8,7 @@ ignore "data/ignore.txt"
        table misc_beginword.hi_ur "data/misc_beginword.hi_ur.txt" nodisplay revert
        table misc_endword "data/misc_endword.txt" nodisplay revert
        table special.hi_ur "data/special.hi_ur.txt" nodisplay revert
       -table be.hi_ur "data/be.hi_ur.txt" revert
       +table pairs.hi_ur "data/pairs.hi_ur.txt" nodisplay revert
        
        # Verbs
        
       t@@ -81,14 +81,6 @@ expand na_ui_oi_ai_mascfem na_ui_oi_ai_mascfem_forms noroot
        
        # Conversion rules
        
       -group
       -replace special.hi_ur
       -endgroup
       -
       -group beginword endword
       -replace be.hi_ur
       -endgroup
       -
        match "(?<=ी)ओ-" " و "
        match "(?<=ा)ए-" "ٔ "
        match "(?<=ी)ए-" "ِ "
       t@@ -101,14 +93,18 @@ match "(?<![0123456789]) :" ":" endword
        
        matchignore "[0123456789]+" beginword endword
        
       -group beginword
       -replace misc_beginword.hi_ur
       +group beginword endword
       +replace pairs.hi_ur
        endgroup
        
        group endword
        replace misc_endword
        endgroup
        
       +group
       +replace special.hi_ur
       +endgroup
       +
        group beginword endword
        replace na_ifemshort
        replace na_adjectiveregular_a_i
       t@@ -132,6 +128,29 @@ replace verbs_regular_consonant_ending
        replace verbs_regular_ending_in_a_o
        endgroup
        
       +group beginword
       +replace misc_beginword.hi_ur
       +endgroup
       +
       +group beginword endword
       +replace na_ifemshort
       +replace na_adjectiveregular_a_i
       +replace na_irregular
       +replace na_ahmasc
       +replace na_aimasc
       +replace na_amasc
       +replace na_an
       +replace na_cfem
       +replace na_cmasc
       +replace na_ifem
       +replace na_imasc
       +replace na_o_a_staysfem
       +replace na_u_staysfem
       +replace na_o_a_staysmasc
       +replace na_u_staysmasc
       +replace na_ui_oi_ai_mascfem
       +endgroup
       +
        group
        replace punctuation
        endgroup
   DIR diff --git a/config.ur_hi b/config.ur_hi
       t@@ -9,7 +9,6 @@ table misc_beginword.ur_hi "data/misc_beginword.ur_hi.txt" nodisplay
        table misc_endword "data/misc_endword.txt" nodisplay
        table special.ur_hi "data/special.ur_hi.txt" nodisplay
        
       -
        # Verbs
        
        table verbs_irregular "data/verbs/irregular.txt"
   DIR diff --git a/data/be.hi_ur.txt b/data/be.hi_ur.txt
       t@@ -1,19 +0,0 @@
       -آمنے سامنے        आमने-सामने
       -بیٹا        बेटा
       -بیٹے        बेटे
       -بیتوں        बेटों
       -بیٹی        बेटी
       -بیٹیاں        बेटियाँ
       -بیٹیوں        बेटियों
       -بہتر        बेहतर
       -بہترین        बेहतरीन
       -بیروتا        बेरोता
       -بیریہ        बेरिया
       -بیل شضر        बेलशज़्ज़र
       -بیل شَضَر        बेलशज़्ज़र
       -بیل طشَضَر        बेलशज़्ज़र
       -بیواؤں        बेवाओं
       -بیوائیں        बेवाएँ
       -بیوہ        बेवा
       -لمبے چوڑے        लंबे-चौड़े
       -
   DIR diff --git a/data/nouns_adjectives/ahmasc.txt b/data/nouns_adjectives/ahmasc.txt
       t@@ -401,7 +401,7 @@
        مظاہر        मुज़ाहर
        معائن        मुआयन
        معاشر        मुआशर
       -معاف شد        मुआफ़शुद
       +معاف شد        माफ़शुद
        معالج        मुआलज
        معامل        मामल
        معاہد        मुआहद
       t@@ -475,3 +475,4 @@
        وعد        वाद
        وقف        वक़्फ़
        یتیم خان        यतीमख़ान
       +عوضان        एवज़ान
   DIR diff --git a/data/nouns_adjectives/cfem.txt b/data/nouns_adjectives/cfem.txt
       t@@ -266,7 +266,7 @@
        جان        जान
        جاہ        जाह
        جدل        जदल
       -جرأت        जुरअत
       +جرأت        जुर्रत
        جراحت        जर्राहत
        جڑ        जड़
        جسامت        जसामत
       t@@ -484,7 +484,7 @@
        سازش        साज़िश
        سازِش        साज़िश
        ساس        सास
       -سال گرہ        साल-गिरह
       +سال گرہ        सालगिरह
        سالمیت        सालिमियत
        ساہول        साहूल
        سبقت        सबक़त
       t@@ -919,3 +919,6 @@
        یکسانیت        यकसानियत
        یگانگت        यगांगत
        یہودیت        यहूदियत
       +ناؤ        नाव
       +بھیک        भीख
       +پھٹکار        फटकार
   DIR diff --git a/data/nouns_adjectives/cmasc.txt b/data/nouns_adjectives/cmasc.txt
       t@@ -574,7 +574,7 @@
        توہم        तवह्हुम
        تیار        तैयार
        تیتر        तीतर
       -تیرانداز        तीर-अंदाज़
       +تیرانداز        तीरंदाज़
        تیر        तीर
        تیزتر        तेज़तर
        تیز رفتار        तेज़रफ़्तार
       t@@ -617,7 +617,7 @@
        جج        जज
        جدید        जदीद
        جذبات انگیز        जज़बात-अंगेज़
       -جرأت مند        जुरअतमंद
       +جرأت مند        जुर्रतमंद
        جرم        जुर्म
        جُرم        जुर्म
        جرنیل        जरनैल
       t@@ -836,7 +836,7 @@
        خوش باش        ख़ुशबाश
        خوشبودار        ख़ुशबूदार
        خوش حال        ख़ुशहाल
       -خوش قسمت        ख़ुशक़िस्मत
       +خوش قسمت        ख़ुशक़िसमत
        خوش گوار        ख़ुशगवार
        خوش مزاج        ख़ुशमिज़ाज
        خوش نصیب        ख़ुशनसीब
       t@@ -1133,7 +1133,7 @@
        سبزہ زار        सब्ज़ाज़ार
        سبق        सबक़
        سپاہ سالار        सिपाहसालार
       -سپرد        सपुर्द
       +سپرد        सुपुर्द
        سپرنٹنڈنٹ        सुपरिण्टेण्डेण्ट
        سپہ سالار        सिपहसालार
        ستار        सितार
       t@@ -1396,7 +1396,6 @@
        عزم        अज़म
        عزیز        अज़ीज़
        عشق        इश्क़
       -عصا         असा
        عصب        असब
        عصر        असर
        عصمت فروش        इसमतफ़रोश
       t@@ -2097,7 +2096,7 @@
        مہربان        मेहरबान
        مہردار        मोहरदार
        مَہر        महर
       -مُہر        मोहर
       +مُہر        मुहर
        مہر        मोहर$महर
        مہک دار        महकदार
        مہلک        मोहलक
   DIR diff --git a/data/nouns_adjectives/ifem.txt b/data/nouns_adjectives/ifem.txt
       t@@ -212,7 +212,7 @@
        تُوڑ        तूड़
        توہم پرست        तवह्हुमपरस्त
        تیار        तैयार
       -تیرانداز        तीर-अंदाज़
       +تیرانداز        तीरंदाज़
        تیور        त्योर
        ثابت قدم        साबितक़दम
        ٹڈ        टिड्ड
       t@@ -359,7 +359,7 @@
        خوش بیان        ख़ुशबयान
        خوش حال        ख़ुशहाल
        خوش خبر        ख़ुशख़बर
       -خوش قسمت        ख़ुशक़िस्मत
       +خوش قسمت        ख़ुशक़िसमत
        خوش گپ        ख़ुश-गप्प
        خوش مزاج        ख़ुशमिज़ाज
        خوش نصیب        ख़ुशनसीब
       t@@ -710,7 +710,7 @@
        مستعد        मुस्तैद
        مست        मस्त
        مضبوط        मज़बूत
       -معاف        मुआफ़
       +معاف        माफ़
        معمور        मामूर
        معمول        मामूल
        مفلس        मुफ़लिस
   DIR diff --git a/data/nouns_adjectives/irregular.txt b/data/nouns_adjectives/irregular.txt
       t@@ -615,6 +615,7 @@
        اشور بنی پال        अशूरबनीपाल
        اشیاء        अशया
        اشیا        अशया
       +عصا        असा
        اصبون        इसबून
        اِصبون        इसबून
        اصطلاحات        इस्तिलाहात
       t@@ -1027,6 +1028,7 @@
        اوفیر        ओफ़ीर
        اوقات        औक़ात
        اوگوستس        औगुस्तुस
       +لگ بھگ        लगभग
        اَوگوستُس        औगुस्तुस
        اولائی        ऊलाई
        اُولائی        ऊलाई
       t@@ -1447,7 +1449,7 @@
        بھی        भी
        بہاؤ        बहाव
        بہترین        बेहतरीन
       -بہر حال        बहर हाल
       +بہر حال        बहरहाल
        بہر        बहर
        بہل        बहल
        بہم        बहम
       t@@ -1482,7 +1484,7 @@
        بیت المقدس        बैतुल-मुक़द्दस
        بیت المُقدّس        बैतुल-मुक़द्दस
        بیت ایضل        बैत-एज़ल
       -بیت ایل        बैत-एल
       +بیت ایل        बैतेल
        بیت بارہ        बैत-बारा
        بیت بری        बैत-बिरी
        بیت بِری        बैत-बिरी
       t@@ -4393,20 +4395,20 @@
        قریب ترین        क़रीबतरीन
        قریتائم        क़िरियतायम
        قِریَتائم        क़िरियतायम
       -قریت اربع        क़िरयत-अरबा
       -قِریَت اربع        क़िरयत-अरबा
       -قریت بعل        क़िरयत-बाल
       -قِریَت بعل        क़िरयत-बाल
       -قریت حصات        क़िरयत-हुसात
       -قِریَت حصات        क़िरयत-हुसात
       -قریت سفر        क़िरयत-सिफ़र
       -قِریَت سِفر        क़िरयत-सिफ़र
       -قریت سنہ        क़िरयत-सन्ना
       -قِریَت سنّہ        क़िरयत-सन्ना
       -قریت یعریم         क़िरयत-यारीम
       -قِریَت یعریم         क़िरयत-यारीम
       -قریت        क़िरयत
       -قِریَت        क़िरयत
       +قریت اربع        क़िरियत-अरबा
       +قِریَت اربع        क़िरियत-अरबा
       +قریت بعل        क़िरियत-बाल
       +قِریَت بعل        क़िरियत-बाल
       +قریت حصات        क़िरियत-हुसात
       +قِریَت حصات        क़िरियत-हुसात
       +قریت سفر        क़िरियत-सिफ़र
       +قِریَت سِفر        क़िरियत-सिफ़र
       +قریت سنہ        क़िरियत-सन्ना
       +قِریَت سنّہ        क़िरियत-सन्ना
       +قریت یعریم         क़िरियत-यारीम
       +قِریَت یعریم         क़िरियत-यारीम
       +قریت        क़िरियत
       +قِریَت        क़िरियत
        قریح        क़रीह
        قریوت حصرون        क़रियोत-हसरोन
        قریوت        क़रियोत
       t@@ -5220,7 +5222,7 @@
        مطیع        मुती
        مظاہر        मज़ाहर$मुज़ाहिर
        معارہ        मआरा
       -معاف        मुआफ़
       +معاف        माफ़
        معاملات        मामलात
        معانی        मानी
        معترضین        मोतरिज़ीन
       t@@ -6221,3 +6223,11 @@
        سب میں        सबमें
        بر        बर्र
        بنا        बिना
       +بِنا        बिना
       +بِِن        बिन
       +کرامات        करामात
       +رب الکریم        रब्बुल-करीम
       +کرامات        करामात
       +سب ہی        सभी
       +رب العظیم        रब्बुल-अज़ीम
       +مسیحا        मसीहा
   DIR diff --git a/data/nouns_adjectives/o_a_staysfem.txt b/data/nouns_adjectives/o_a_staysfem.txt
       t@@ -38,3 +38,4 @@
        ہَوا        हवा
        وبا        वबा
        وفا        वफ़ा
       +گپھا        गुफा
   DIR diff --git a/data/pairs.hi_ur.txt b/data/pairs.hi_ur.txt
       t@@ -0,0 +1,8 @@
       +آمنے سامنے        आमने-सामने
       +بیٹا بیٹی        बेटा-बेटी
       +بیٹے بیٹیاں        बेटे-बेटियाँ
       +بیٹے بیٹیوں        बेटे-बेटियों
       +نواسے نواسیاں        नवासे-नवासियाँ
       +نواسے نواسیوں        नवासे-नवासियों
       +پوتے پوتیاں        पोते-पोतियाँ
       +پوتے پوتیوں        पोते-पोतियों
   DIR diff --git a/data/special.hi_ur.txt b/data/special.hi_ur.txt
       t@@ -2,7 +2,7 @@
         و         ो-
        ذرائعِ         ज़राएये-
        انبیائے         अंबियाए-
       -دریائے         दरियाए-
       +دریائے         दरयाए-
        خدائے         ख़ुदाए-
        عصائے         असाए-
        سزائے         सज़ाए-
       t@@ -12,7 +12,6 @@
        کارہائے         कारहाए-
        ماورائے         मावराए-
        اِبتدائے         इब्तिदाए-
       -ابتدائے         इब्तिदाए-
        بنائے         बनाए $बिनाए-
        گھبرائے        घबराए
        برائے         बराए-
   DIR diff --git a/data/special.ur_hi.txt b/data/special.ur_hi.txt
       t@@ -19,4 +19,3 @@
        اشیائے         अश्याए-
         سالہ        -साला
         با          बा-
       - بہ          ब
   DIR diff --git a/data/verbs/irregular.txt b/data/verbs/irregular.txt
       t@@ -340,3 +340,5 @@
        سہنے        सहने
        سہنی        सहनी
        سہئے        सहिए
       +مسیحا        मसीहा
       +جریکو        जेरिको
   DIR diff --git a/data/verbs/regular_consonant_ending.txt b/data/verbs/regular_consonant_ending.txt
       t@@ -1,4 +1,3 @@
       -
        ابال        उबाल
        اُبال        उबाल
        ابل        उबल
       t@@ -301,7 +300,7 @@
        ڈھانک        ढाँक
        ڈھک        ढक
        ڈھل        ढल
       -ڈھونڈ        ढ़ूँड
       +ڈھونڈ        ढूँड
        ڈوب        डूब
        رچ        रच
        رَچ        रच
       t@@ -494,3 +493,4 @@
        ہڑپ        हड़प
        ہل        हिल
        ہنس        हँस
       +تھم        थम
   DIR diff --git a/data/verbs/regular_ending_in_a_o.txt b/data/verbs/regular_ending_in_a_o.txt
       t@@ -167,8 +167,6 @@
        دھمکا        धमका
        دھندلا        धुँधला
        دھو        धो
       -دہرایا        दोहरा
       -دُہرایا        दोहरा
        دہرا        दोहरा
        دُہرا        दोहरा
        دوڑا        दौड़ा