6tehila / PractiCode2

Html Serializer

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

#פרויקט 2 | Html Serializer #תיאור הפרויקט בפרויקט זה נפתח כלי לטיפול ועיבוד של Html.

ניתן להשתמש בכלי כזה לצרכים שונים, לדוגמא כדי לממש Crawler.

Crawler (או Scrapper) הוא מנגנון שקורא אתרי אינטרנט ומנתח את ה-Html שלהם כדי לחלץ ממנו את המידע הרצוי. למעשה, זה בדיוק מה שעושה מנוע החיפוש של גוגל (ואחרים). המנוע סורק את האינטרנט ומנתח את ה-Html של כל האתרים במטרה לאנדקס את המידע כך שיוכל לאחזר אותו בהתאם לשאילתות החיפוש שהמשתמשים מבקשים.

דוגמאות נוספות לשימוש ב-Crawling:

ניתוח אתרי אינטרנט כדי לגלות באיזה טכנולוגיות הם כתובים ובאיזה ספריות קוד הם משתמשים. שליפת נתונים מאתרי קניות או יד שניה כדי להציג באתר אחר. ועוד ועוד.

בפרויקט זה נפתח את הקוד התשתיתי שבהמשך נוכל להשתמש בו כדי לפתח Crawler משלנו.

About

Html Serializer


Languages

Language:C# 100.0%