srix / pytamil

பைந்தமிழ் (pytamil) library is intended to be used in analysis of tamil literary work. A wealth of knowledge is hidden in old literature. They are time machines to past. Ever wondered what is the popular color or food in tamil speaking world in 500AD. The answer is hidden in literature. With right computer tools it becomes possible for us to dig in to this wealth of knowledge.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

பைந்தமிழ் (pytamil)

A Library that can do the following

தமிழ் எழுத்து மற்றும் புணர்ச்சி

எழுத்து.மெல்லினம்

['ங்', 'ஞ்', 'ண்', 'ந்', 'ம்', 'ன்']

எழுத்து.குறில்

['அ', 'இ', 'உ', 'எ', 'ஒ']

புணர்ச்சி.தனிமொழி_ஆக்கு('விருந்தோம்பல்')

['விருந்து', 'ஓம்பல்']

புணர்ச்சி.தொடர்மொழி_ஆக்கு('விருந்து', 'ஓம்பல்' )

விருந்தோம்பல்

மாத்திரை.மாத்திரை_கொடு('பைந்தமிழ்')

[2, 0.5, 1, 1, 0.5]

தற்போதைய எழுத்துக்களை பண்டைய எழுத்துக்களாக மாற்றுதல்

தமிழ்.பிரம்மி('வணக்கம்')

𑀯𑀡𑀓𑀓𑀫

தமிழ்.பண்டைய_வாக்கியம்_ஆக்கு(வாக்கியம் = 'வணக்கம்', வருடம் = 300 )

யாப்பு ஆராய்தல்

திருக்குறள் : பொருட்பால் : குறள் 467

எண்ணித் துணிகக் கருமம் துணிந்தபின்
எண்ணுவம் என்பது இழுக்கு

kural_parse_tree

புகழேந்திப் புலவர் இயற்றிய நளவெண்பா : 1

ஆதித் தனிக்கோல மானா னடியவற்காச்
சோதித் திருத்தூணிற் றோன்றினான் வேதத்தின்
முன்னின்றான் வேழம் முதலே யெனவழைப்ப
என்னென்றா னெங்கட் கிறை

nerisai_parse_tree

Why Pytamil

பைந்தமிழ் (pytamil) library is intended to be used in analysis of tamil literary work. A wealth of knowledge is hidden in old literature. They are time machines to past. Ever wondered what is the popular color or food in tamil speaking world in 500AD. The answer is hidden in literature. With right computer tools it becomes possible for us to dig in to this wealth of knowledge.

Core philosophy of பைந்தமிழ் (pytamil) library is to clearly separarte tamil language conepts from the programming language. For example, Tamil புணர்ச்சி rules are captured in human readable text file புணர்ச்சிவிதிகள்.yaml in YAML format. This approach has two major benefits

  1. This allows people with no prior knowledge in computer programming to contribute to the project and have more meaningful and natural discussion on the language concepts.
  2. Similar approach can be used to implement libraries for other human languages like Sanskrit, Telugu, Kannada etc.
  3. Developers can use the core tamil language files to port this library to other computer languages like Javascript, c# etc.

List of Core tamil language files

TODO

If you have a feature in mind, Please add a feature request here with label as enhancement.

  • return original words when a combined word is presented by predictive deomposition using புணர்ச்சி விதிகள்
  • built pip module
  • and many more

For Developers

Getting started

About

பைந்தமிழ் (pytamil) library is intended to be used in analysis of tamil literary work. A wealth of knowledge is hidden in old literature. They are time machines to past. Ever wondered what is the popular color or food in tamil speaking world in 500AD. The answer is hidden in literature. With right computer tools it becomes possible for us to dig in to this wealth of knowledge.

License:MIT License


Languages

Language:Python 94.9%Language:ANTLR 4.9%Language:Shell 0.2%