This repository contains an opensourced dataset for Hindi Language, can be used for machine learning tasks.
मैं artificial intelligence में शोध करता हूं | प्राकृतिक भाषा प्रसंस्करण ( Natural Language Processing ) मेरा अध्ययन का क्षेत्र है |मैंने एक कृत्रिम बॉट का निर्माण किया है और इसे ट्विटर पर पोस्ट किया है | HeiligeQuotes बॉट का नाम हेइलिग्यूक्वेट्स है | twitter.com/heiligequotes | अब मैं हिंदी में योगदान देना चाहता हूं | मैं हिंदी भाषा के लिए एक समान बॉट पोस्ट करना चाहता हूं | वह बॉट वार्ता और दूसरों को अपने विचार साझा करते हैं | डाटासेट की अक्षमता ही एकमात्र समस्या है | यदि आप लोग एक डाटासेट को विकसित करने में योगदान दे सकते हैं, तो कई शोधकर्ता हिंदी भाषा के लिए कृत्रिम बुद्धि का निर्माण कर सकते हैं | और यह डेटासेट अन्य शोधकर्ताओं के उपयोग के लिए नि: शुल्क होगा | इससे हिंदी की स्थिति में सुधार होगा | मैं पहले से ही हिंदी में चाणक्य के उद्धरण एकत्र करने पर काम कर रहा हूं | अगर कोई योगदान करना चाहता है तो कृपया मुझे बताएं |
डेटासेट के विकास में योगदान करते समय कृपया इस प्रारूप का अनुसरण करें
please follow this format while contributing to the development of the dataset
यह डेटासेट हिंदी उद्धरणों का एक संग्रह होगा | (this dataset will be a collection of hindi QUOTES)
प्रत्येक पंक्ति में केवल एक कहावत होगी |
कृपया प्रत्येक शब्द के बीच एक स्थान डालें |
कृपया प्रत्येक शब्द और चिह्न (विराम, अल्पविराम ) के बीच एक स्थान डालें |
उदाहरण के लिए :
भविष्य में आने वाली मुसीबतो के लिए धन एकत्रित करें। ऐसा ना सोचें की धनवान व्यक्ति को मुसीबत कैसी ? जब धन साथ छोड़ता है तो संगठित धन भी तेजी से घटने लगता है ।
उद्धरण इकट्ठा करने के बाद कृपया उस फ़ाइल को उस उद्धरण के लेखक के नाम से सहेजें |
हिंदी उद्धरणों की एक डेमो फाइल आप सभी के साथ साझा की जाती है |
इसमें चाणक्य के सभी उद्धरण शामिल थे, इसके फ़ाइल नाम भी चाणक्य था | ( chanakya.txt )