Updated hi.json to support infra for entity,pronoun_patterns,dialogue_patterns,direct_address_pattern, project_verb_patterns and stopwords

This commit is contained in:
Tejas Shinde
2026-04-15 23:33:24 +05:30
parent ce3ae0a668
commit 33a98fb9d1
+62 -2
View File
@@ -39,6 +39,66 @@
"topic_pattern": "[\\u0900-\\u097F]{2,}|[A-Za-z][A-Za-z0-9_]{2,}",
"stop_words": "यह वह ये वे कुछ कई अधिकांश प्रत्येक हर अन्य केवल ऐसा बहुत होगा सकता चाहिए ज़रूर हाँ ठीक भी फिर अब पहले अभी वापस पूरा बनाना लेना देना जानना सोचना चाहना ज़रूरत जा आ आना जाना ढूँढना काम जोड़ा सहेजा सत्र सारांश वार्तालाप स्रोत विषय के एक बार बस वास्तव में कहाँ यहाँ वहाँ धन्यवाद कृपया सही गलत करें किया करता करती चलाएँ उपयोग",
"quote_pattern": "\"([^\"]{20,200})\"",
"action_pattern": "(?:built|fixed|wrote|added|pushed|measured|tested|reviewed|created|deleted|updated|configured|deployed|migrated)\\s+[\\w\\s]{3,30}"
"action_pattern": "(?:बनाया|सुधारा|लिखा|जोड़ा|भेजा|मापा|परीक्षण किया|समीक्षा की|निर्मित किया|हटाया|अद्यतन किया|विन्यस्त किया|तैनात किया|स्थानांतरित किया)\\s+[\\w\\s]{3,30}"
},
"entity": {
"candidate_pattern": "[\\u0900-\\u097F]{2,20}",
"multi_word_pattern": "[\\u0900-\\u097F]+(?:\\s+[\\u0900-\\u097F]+)+",
"person_verb_patterns": [
"\\b{name}\\s+ने\\s+कहा\\b",
"\\b{name}\\s+ने\\s+पूछा\\b",
"\\b{name}\\s+ने\\s+बोला\\b",
"\\b{name}\\s+ने\\s+बताया\\b",
"\\b{name}\\s+हँसा\\b",
"\\b{name}\\s+मुस्कुराया\\b",
"\\b{name}\\s+रोया\\b",
"\\b{name}\\s+सोचा\\b",
"\\b{name}\\s+चाहा\\b",
"\\b{name}\\s+पसंद\\s+किया\\b",
"\\b{name}\\s+नफरत\\s+की\\b",
"\\b{name}\\s+जानता\\s+है\\b"
],
"pronoun_patterns": [
"\\bवह\\b",
"\\bउसने\\b",
"\\bउसे\\b",
"\\bउसका\\b",
"\\bउन्होंने\\b",
"\\bउनका\\b",
"\\bवे\\b"
],
"dialogue_patterns": [
"^>\\s*{name}[:\\s]",
"^{name}:\\s",
"^\\[{name}\\]",
"\"{name}\\s+ने\\s+कहा"
],
"direct_address_pattern": "\\bअरे\\s+{name}\\b|\\bनमस्ते\\s+{name}\\b|\\bधन्यवाद\\s+{name}\\b",
"project_verb_patterns": [
"\\b{name}\\s+बना\\s+रहा\\s+है\\b",
"\\b{name}\\s+बनाया\\b",
"\\b{name}\\s+लॉन्च\\s+किया\\b",
"\\b{name}\\s+तैनात\\s+किया\\b",
"\\b{name}\\s+इंस्टॉल\\s+किया\\b"
],
"stopwords": [
"यह", "वह", "ये", "वे",
"मैं", "हम", "आप", "तुम",
"मेरा", "हमारा", "आपका", "उसका", "उनका",
"मुझे", "हमें", "आपको", "उसे", "उन्हें",
"का", "के", "की",
"को", "से", "में", "पर",
"के लिए", "के साथ", "के बारे में", "द्वारा",
"और", "या", "लेकिन", "क्योंकि", "तो", "यदि",
"भी", "ही", "सिर्फ", "केवल",
"है", "हैं", "था", "थे", "थी",
"हो", "होगा", "होता", "होती",
"कर", "करना", "किया", "करते", "करती",
"नहीं", "हाँ", "शायद", "ज़रूर",
"क्या", "कौन", "कब", "कहाँ", "क्यों", "कैसे",
"अब", "तब", "यहाँ", "वहाँ",
"बहुत", "कम", "अधिक",
"कुछ", "कोई", "सब", "हर"
]
}
}
}