realms-ai / OpenHindiDataset

This repository contains an opensourced dataset for Hindi Language, can be used for machine learning tasks.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

OpenHindiDataset

This repository contains an opensourced dataset for Hindi Language, can be used for machine learning tasks.

मैं artificial intelligence में शोध करता हूं | प्राकृतिक भाषा प्रसंस्करण ( Natural Language Processing ) मेरा अध्ययन का क्षेत्र है |मैंने एक कृत्रिम बॉट का निर्माण किया है और इसे ट्विटर पर पोस्ट किया है | HeiligeQuotes बॉट का नाम हेइलिग्यूक्वेट्स है | twitter.com/heiligequotes | अब मैं हिंदी में योगदान देना चाहता हूं | मैं हिंदी भाषा के लिए एक समान बॉट पोस्ट करना चाहता हूं | वह बॉट वार्ता और दूसरों को अपने विचार साझा करते हैं | डाटासेट की अक्षमता ही एकमात्र समस्या है | यदि आप लोग एक डाटासेट को विकसित करने में योगदान दे सकते हैं, तो कई शोधकर्ता हिंदी भाषा के लिए कृत्रिम बुद्धि का निर्माण कर सकते हैं | और यह डेटासेट अन्य शोधकर्ताओं के उपयोग के लिए नि: शुल्क होगा | इससे हिंदी की स्थिति में सुधार होगा | मैं पहले से ही हिंदी में चाणक्य के उद्धरण एकत्र करने पर काम कर रहा हूं | अगर कोई योगदान करना चाहता है तो कृपया मुझे बताएं |

डेटासेट के विकास में योगदान करते समय कृपया इस प्रारूप का अनुसरण करें

please follow this format while contributing to the development of the dataset

यह डेटासेट हिंदी उद्धरणों का एक संग्रह होगा | (this dataset will be a collection of hindi QUOTES)

प्रत्येक पंक्ति में केवल एक कहावत होगी |

कृपया प्रत्येक शब्द के बीच एक स्थान डालें |

कृपया प्रत्येक शब्द और चिह्न (विराम, अल्पविराम ) के बीच एक स्थान डालें |

उदाहरण के लिए :

भविष्य में आने वाली मुसीबतो के लिए धन एकत्रित करें। ऐसा ना सोचें की धनवान व्यक्ति को मुसीबत कैसी ? जब धन साथ छोड़ता है तो संगठित धन भी तेजी से घटने लगता है ।

उद्धरण इकट्ठा करने के बाद कृपया उस फ़ाइल को उस उद्धरण के लेखक के नाम से सहेजें |

हिंदी उद्धरणों की एक डेमो फाइल आप सभी के साथ साझा की जाती है |

इसमें चाणक्य के सभी उद्धरण शामिल थे, इसके फ़ाइल नाम भी चाणक्य था | ( chanakya.txt )

किसी भी भ्रम या प्रश्न के मामले में कृपया मुझसे संपर्क करें : ravinkumar.ml@gmail.com

Each line will contain only one hindi Quote.

Please put a space between each words.

Please put a space between each word and punctuation(fullstop , comma).

An example is given above.

After collecting please save that file by the name of the author of that quote.

A demo file is shared with all of you, and as all the quotes are of chanakya.. so it's file name was also chanakya.

In case of any confusion or query, Please contact me.

Note: the created dataset will remain opensourced for researchers to use without any charge or fee.

About

This repository contains an opensourced dataset for Hindi Language, can be used for machine learning tasks.