arezabfn / PdfTranslate

Extracting the most frequent words in PDF, finding roots, showing the degree of difficulty, preparing for printing

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

این پروژه ایست که میتواند برای یادگیری زبان ، یا مطالعه مقالات ، مجله ، کتاب ، ... به زبان نیتیو کمک کند ما در اینجا یک فایل را آپلود میکنیم(در نسخه آزمایشی تنها فایل مجاز pdf است) تمام محتوای نوشتاری آن داخل یک متغیر ریخته میشود و سپس تمام محتوای آن متغیر به صورت token token درآورده میشود ، به این ترتیب ما تمام کلمات یک pdf را درون یک آرایه موجود داریم که امکانات زیر را در دسترس داریم:

  • ما دو جدول داریم به اسم های simple (کلمات ساده و بدیهی) , known (کلماتی که یاد گرفتیم و معنی آن ها را میدانیم) تمام محتوای این جدول ها از کل کلمات حذف میشوند و کلمات نهایی به صورتی فیلتر میشوند که حتما کلمات ناآشنا و جدید با تعداد تکرار آنها برای ما در جدول (unknown) خروجی داده شوند 1- میتوان pdf های آپلود شده را مدیریت کرد 2- تمام کلمات را بر اساس تعداد تکرار آنها یا ویژگی های دیگر مرتب سازی کرد 3- معنی هر کلمه را فهمید 4-از هر جدول میتوان خروجی هایی به صورت pdf , csv , excel گرفت *برای اجرای پروژه محتوای درون پوشه node_modules باید دانلود و به پروژه اضاف شود

                                                                  در این بخش عکس هایی از محیط سایت مشاهده میکنید
    

1

2

dashboard-3

4-unknow

5-simple

6-known

About

Extracting the most frequent words in PDF, finding roots, showing the degree of difficulty, preparing for printing


Languages

Language:PHP 57.8%Language:Blade 38.2%Language:CSS 3.6%Language:JavaScript 0.2%Language:SCSS 0.2%