איתור מידע היסטורי: כשסוכני AI פועלים כחוקרים בעלי מאות עיניים
השאלה: מה באמת קרה? כאשר המידע על אירוע היסטורי הוא חלקי, סותר, או פשוט לא קיים במקום שציפית למצוא אותו - איך מרכיבים את הפאזל?
במאמר הזה נשתף פרויקט שעסק בדיוק באתגר הזה: שחזור של אירוע מתועד חלקית בלבד, תוך שימוש בסוכני מחקר (AI agents) שעבדו במקביל על עשרות מקורות.
הרקע: אירוע שנמחק למחצה
ללקוח שלנו - מוסד מחקרי - הייתה שאלה ספציפית: לשחזר את פרטי אירוע מסוים משנות ה-50 של המאה ה-20. תיעוד רשמי של האירוע היה דליל, עיתונות התקופה העלתה אזכורים מעטים ומעורפלים, וקיים חשד שחלק מהמסמכים הוסרו מהארכיון באופן יזום.
ההחלטה: לא להסתפק במקורות "הגלויים" אלא לפרוש חיפוש רחב על פני כל קצוות המידע הנגיש - מתוך תקווה שצירוף של עדויות עקיפות ימלא את הפער.
הגישה הקלאסית (וכשליה)
בעבר, סוג כזה של מחקר היה דורש:
- קריאה של אלפי עמודים של פרוטוקולים
- חיפוש ביותר מ-20 ארכיונים שונים, פיזית
- ראיונות עם מי שנותר חי שאולי זוכר
- איתור צאצאי דמויות משניות שאולי שמרו מסמכים פרטיים
- הצלבת תאריכים ופרטים בין מקורות שונים
זמן מוערך: 5-7 שנים. עלות: גבוהה מאוד. סבירות להשגת שלמות: נמוכה.
הגישה החדשה: רשת של סוכני מחקר
בנינו צוות של סוכני LLM מתמחים, כל אחד עם "תפקיד" משלו, שעבדו במקביל:
סוכן 1: חוקר עיתונות התקופה
קרא באופן מרוכז את כל גיליונות 14 עיתונים מרכזיים של השנתיים שלפני ואחרי האירוע, וחיפש:
- אזכורים ישירים
- אזכורים עקיפים (על ידי שמות אנשים ומקומות רלוונטיים)
- מודעות, הודעות ומודעות אבל
- דיווחים מעוצבים כ"אירועים אחרים" שאולי הם אותו אירוע בכסות אחרת
סוכן 2: חוקר פרוטוקולים ממשלתיים
גולש במקביל על פרוטוקולים רלוונטיים שפורסמו באתרים הממשלתיים וארכיון המדינה, ומאתר:
- אזכורים של שמות הדמויות המעורבות- דיונים בתקופות הרלוונטיות
- החלטות שנראות כ"תגובה" על האירוע גם אם לא מזכירות אותו ישירות
סוכן 3: חוקר זיכרונות וביוגרפיות
סרק דיגיטלית יותר מ-200 ביוגרפיות, זיכרונות אוטוביוגרפיים ומכתבים של דמויות תקופתיות שיכלו להיות מעורבות או לדעת - וחיפש אזכורים, רמיזות, או "שתיקות רועשות".
סוכן 4: חוקר הצלבות
קיבל כל ממצא מהסוכנים האחרים, ובדק אותו כנגד:
- מאגרי אנשים (Who's Who, מאגרי יודאיקה)
- מאגרי אירועים (כרוניקות, מפתחות נושאיים)
- לוח תאריכים - לבדוק אם פרטים מסוימים "מצטלצלים" אלו כנגד אלו
סוכן 5: כתב הדוח
ריכז את כל הממצאים לתיעוד מובנה, עם ציטוט מלא לכל מקור, רמת ודאות לכל עובדה, והמלצות על כיווני מחקר שהנתונים מצביעים עליהם.
מה מצאנו
המחקר הזה חשף תמונה מורכבת הרבה יותר ממה שהעיתונות של אז הציעה:
- 7 דמויות נוספות שהיו מעורבות, ושמן לא עלה בשום מקום גלוי
- ציר זמן מפורט של 11 ימי האירוע - שבחלקו סתר את הרישום הרשמי ב-3 ימים מרכזיים
- לפחות 4 מסמכים שאותרו בארכיונים פרטיים של בני משפחה - שאיש לא ידע על קיומם
- רשת של קשרים בין דמויות שעד אז נתפסו כמנותקות זו מזו
הלקח החשוב ביותר
הלקח שלקחנו מהפרויקט הזה: לא כל מחקר דורש את אותו סוג של AI.
- לחיפוש בטקסט - RAG
- לזיהוי תבניות - LLM עם prompts ממוקדים
- לחקירה מרובת-מקורות - סוכנים עצמאיים עם תפקידים מוגדרים
התזמור של הכלים האלה - איזה סוכן מעביר איזה מידע למי, מי מאמת, מי מסכם - הוא הערך המוסף המקצועי שלנו.
זמן ותוצאה
הזמן הכולל: 4 חודשים. עלות: פחות מ-15% מהערכת הגישה המסורתית. איכות: מסמך מחקר של 180 עמודים, עם 600+ הערות שוליים הפניות, שאפשר לחוקר הבכיר לכתוב על ידו מאמר אקדמי שפורסם כעבור שנה.
המחקר הסמוי שלך
אם יש לך שאלה היסטורית שאתה מרגיש שאין דרך למצוא עליה תשובה - אולי יש. שילוב נכון של טכנולוגיה, מתודולוגיה ארכיונית וסבלנות יכול לחשוף מה שלדורות חשבו שנמחק.
