הישג אשדודי: סטודנט תושב העיר הציג מחקר פורץ דרך בכנס בינלאומי
01.04.24 / 16:21
איתי אסרף, סטודנט להנדסת נתונים מאשדוד, זכה יחד עם חבריו ניב פונו, הראל מושיוף ואלדר קרול להישג מרשים כאשר עבודתם המחקרית התקבלה לכנס EACL2024 - כנס בינלאומי יוקרתי בתחום עיבוד שפה טבעית.
הכנס, שנערך השנה במלטה, מושך אליו מיטב החוקרים והסטודנטים מהתחום, ואחוז הקבלה אליו עומד על 16% בלבד.
עובדה זו הופכת את הישגם של הסטודנטים למרשים עוד יותר, כיוון שהם הצליחו להתקבל לכנס במסגרת לימודיהם לתואר ראשון, בעוד שרוב המשתתפים האחרים היו סטודנטים לתארים מתקדמים.
פרויקט הגמר של הסטודנטים עסק בפיתוח מודל חדשני לחיזוי כתבים חסרים במגילות עתיקות בעברית וארמית. נושא זה רלוונטי במיוחד לאור ריבוי הממצאים הארכיאולוגיים העתיקים הקשורים ללאום היהודי בשנים האחרונות.
המודל שפיתחו הסטודנטים משלב מספר מודלים אחרים, תוך ניצול יתרונותיהם, ומאפשר חיזוי מדויק הן של מילים שלמות חסרות והן של חלקי מילים.
הסטודנטים מספרים על הפיתוח
בשנים האחרונות אנו עדים לעלייה בממצאים ארכיאולוגים עתיקים הקשורים ללאום היהודי. ממצאים אלו חשובים לחיזוק הזהות, הקשר לתרבות ולהיסטוריה של העם היהודי. בין ממצאים אלו ניתן למצוא כתבים עתיקים חסרים שנקרעו/ דהו במהלך השנים.
-
המודל שאנו פיתחנו בפרויקט משלים קטעים חסרים מטקסט. ייתכנו מספר אפשרויות לקטע חסר: מילים חסרות, מילה בודדת שחסרה, אות בודדת שחסרה וחלקי מילים.
לאחר סקירת מאמרים רבים על מודלים בתחום וחקירה לעומק את היתרונות והחסרונות שיש בכל אחד מהם, הגענו למספר מסקנות:
- החיסרון במודלים אלו שרובם טובים בחיזוי עבור השפה האנגלית ושאר שפות שאומנו עליהם ( לדוג': יוונית) אך אינם טובים בחיזוי עבור השפה העברית.
- ישנם מודלים שחוזים בצורה טובה מילים שלמות שחסרות אך חוזים בצורה פחות טובה עבור חלקי מילים שחסרים, ולהפך.
-
על כן פיתחנו מודל שמשלב מספר מודלים (שמנצל יתרון של מודל שיודע לחזות בצורה טובה מילים שלמות שחסרות ויתרון של מודל שמנבא היטב חלקי מילים שחסרים) שמאומן על התנ"ך.
במהלך ביצוע המחקר, מימשנו מדדים שבאים לבצע הערכה המודדת את טיב החיזוי תוך בדיקה על אחוזי הסתרה שונים בטקסט.
-
המודל מתממש כחלק ממערכת שפותחה. משתמש יכניס לתוך המערכת טקסט עם חלקים חסרים. עבור החלקים החסרים המערכת תחזיר מספר אפשרויות, בכל אפשרות יש הסתברות להשלמת החלק. כך אנו נעזור להיסטוריונים שמטרת מחקרם הוא לשחזר מגילות וכתבים עתיקים יהודים כמשימת חייהם.
המודל מיושם כחלק ממערכת שפותחה, המאפשרת למשתמשים להזין טקסט עם חלקים חסרים ולקבל מספר אפשרויות להשלמתם, תוך ציון הסתברות לכל אפשרות.
-הצלחת המחקר מדגישה את הפוטנציאל העצום הטמון בסטודנטים הצעירים , ואת יכולתם לפתח פתרונות חדשניים ופורצי דרך בתחומים מאתגרים.
השתתפותם בכנס הבינלאומי היוותה הזדמנות עבורם לייצג את ישראל בגאווה ולהציג את עבודתם בפני קהל בינלאומי רחב.
הסיפור של איתי אסרף וחבריו מעורר השראה וממחיש את חשיבותה של תמיכה וטיפוח הדור הצעיר, הן מבחינה אקדמית והן מבחינה ערכית.
מעוניינים להגיב? לדווח ? צרו איתנו קשר במייל -[email protected]