קטלוג AI לארכיוני שואה

תצלום משנות הארבעים המוקדמות מגיע לתור הקטלוג. אישה מבוגרת במעיל כבד, טלאי צהוב נראה לעין על חזה. רחוב מרוצף, שלט חנות מטושטש באותיות לטיניות. הפיתוי הוא לזהות הכל בבת אחת — איפה זה צולם, מי היא, מתי זה קרה. הדיסציפלינה היא לא לזהות כמעט דבר במעבר הראשון, ולעשות את היתר בשכבות.

הפוסט הזה מתאר מסגרת קטלוג תלת-שכבתית שאנחנו משתמשים בה בניתוח ארכיוני של חומר ויזואלי מתקופת השואה. היא בנויה מעל כלי ראייה (Vision AI) קונבנציונליים, אבל הליבה שלה אינה טכנית — היא אפיסטמית. השאלה שהיא עונה עליה: לפי מה שהתצלום מראה, על מה אני באמת רשאי לטעון?

למה שלוש שכבות ולא אחת

רוב רשומות הקטלוג — ורוב צינורות הראייה המוכנים-מהמדף — מקבצים את הוויזואלי, ההקשרי והאישי לכדי פסקה תיאורית אחת. התוצאה היא פסקה שנשמעת בטוחה בכל החזיתות, ובפועל אינה ניתנת להגנה ברובן.

כל אחת מהשכבות הללו דורשת ראיות שונות וסף ודאות שונה. מודל ראייה מאומן יזהה באמינות מעיל ורמכט בדגם 1940. הוא לא יוכל לומר מי פניו של מי שמופיעים בתצלום, וההעמדה שכן יודע מזהמת את הארכיון. שתי סוגי הטענות שייכות לרשומת קטלוג — אבל ברמות ביטחון שונות לחלוטין, והמבנה חייב להפוך את זה לגלוי.

שכבה 1 — תיאור ויזואלי

מה שהמצלמה תפסה. קומפוזיציה. מסגור. סגנון צילומי, אם ניתן לזיהוי: דיוקן רשמי, סצנת רחוב ספונטנית, תצלום תעמולה רשמי, תצלום משפחתי, מסגרת מעקב.

השכבה הזו לעיתים נדירות שנויה במחלוקת. זה מה שנמצא בפועל במסגרת.

הדיסציפלינה היא להישאר קרוב לפני השטח. "שני אנשים במעילי חורף הולכים ברחוב מרוצף לעבר בניין עם חלון קומת-קרקע סורג" — ולא "שני פליטים בורחים מהגטו". המשפט השני מניח יעד, סטטוס והקשר שהתצלום, לבדו, אינו מוכיח. שכבה 1 משאירה את העבודה הזו לשכבות שלמטה.

שכבה 2 — חפצים ופרטים

השכבה התקופתית-ספציפית. מדים. כלי רכב. נשק. שלטים. טלאים צהובים וסימוני זיהוי אחרים. מסמכים. חזיתות חנויות. אדריכלות. כל דבר בתמונה שנושא חותם תאריך, חתימה אזורית, או עקבה רגולטורית.

כאן מומחיות התחום מתחילה לחשוב. מעיל ורמכט בדגם 1940 הוא סיגנל שונה ממעיל בדגם 1944. סרט זרוע עם מגן דוד נקרא אחרת מטלאי חזה תפור — וההבדל מצביע על תקנות כיבוש ספציפיות משנים ספציפיות.

מודלי ראייה מוכנים-מהמדף ינסו לרוב לנחש את היחידה, את הגדוד, את המבצע המדויק. עין מאומנת אומרת: "מעיל ארוך של ורמכט, דגם 1939–42". קטגוריה רחבה יותר, מרווח טעות צר יותר. השנייה היא מה שארכיון יכול לבנות עליה.

שכבה 3 — אישים

השכבה הרגישה ביותר, וזו שבה סיוע AI הוא המסוכן ביותר.

בתצלומים מתקופת השואה, פנים בדרך כלל קטנות מדי, מוסתרות מדי, או מושפלות צילומית מדי לזיהוי ויזואלי כן — גם כשהמוח של הצופה מתעקש לספק שם. ברירת המחדל בשכבה הזו היא תיאורית, לא שמית:

"דמות מרכזית, אישה בשנות ה-50, בלבוש אזרחי, ראש מכוסה."
"שני ילדים, כבני 8 ו-10 בקירוב, חולקים מעיל יחיד."
"קצין במדים, סימני דרגה גלויים על הצווארון, פנים מוטות חלקית מהמצלמה."

שם מופיע בשכבה 3 רק כאשר יש ראיות חזקות ומאומתות: לוחית שם גלויה, כיתוב ארכיוני ממקור מהימן, או התאמת פנים מול תצלומים מתועדים בידי חוקר שמכיר את הנושא. בלי זה — השם לא שייך לרשומה, לא משנה כמה ניחוש סביר עשוי להרגיש.

זו הנקודה שבה רוב הקטלוגים המסייעי-AI נכשלים. הם מפיקים שמות, השמות נכנסים לארכיון, ולא ניתן למשוך אותם בחזרה.

שכבה 4 — קונטקסט היסטורי

לאחר ששכבות 1–3 מתועדות, ניתן לשכב מעליהן את הקונטקסט ההיסטורי. מה שמתועד שקרה במקום ובזמן מהסוג שהתצלום מציג.

השכבה הזו תמיד מותנית. "אם המיקום עקבי עם הטענה של המוסר לגבי לודז', טווח התאריכים (1941–1944) יחפוף את תקופת הגטו המתועדת." לא "זה מראה את גטו לודז'." המסגור המותנה אינו חולשה — הוא מה שמאפשר לחוקר אחר להעריך את שרשרת ההסקה ולהאריך אותה או לשבור אותה.

סמני ביטחון כדיסציפלינת מקצוע

כל זיהוי בקטלוג מקבל אחד משלושה סמנים:

✓ מאושר — כיתוב נראה לעין, ציון דרך מתועד היטב, כיתוב ארכיוני ממקור מהימן שתומך בטענה.
~ סביר — עקבי עם מספר רמזים ויזואליים, נכון לתקופה, אבל ללא ראיה חד-משמעית.
? ספקולטיבי — דמיון ויזואלי בלבד, או הסקה מסוגה/תקופה; דורש עבודה נוספת לאישוש.

הסמן אינו "הסתייגות". הוא התחייבות מובנית לרמת הראיות שמאחורי הטענה. ~ בקטלוג מוסדי הוא בעל ערך גדול יותר מ-✓ שקט שמניח יותר מדי. שניהם שמישים; שניהם ניתנים לביקורת; שניהם משאירים לחוקר הבא את המידע שדרוש לו כדי לבנות הלאה.

אותה לוגיקה פועלת גם בכיוון ההפוך: אם כל טענה ברשומה מסומנת ✓, קורא מנוסה יודע לחשוד בקטלוגר. עבודה ארכיונית אמיתית מפיקה תערובת.

דוגמה עובדת

תצלום משנות הארבעים המוקדמות, מזרח אירופה. ללא קיטלוג, ללא כיתוב.

ויזואלי: מבוגר וילד, שניהם במעילי חורף, עומדים מול דלת עץ. הדלת נושאת כיתוב בעברית בחלקה העליון, גלוי חלקית.
חפצים: מעיל המבוגר מציג מה שנראה כטלאי מגן דוד צהוב תפור בחזה השמאלי — ✓ עקבי עם תקנות הכיבוש הגרמני משנת 1941 ואילך במזרח אירופה הכבוש. האדריכלות (דלת עץ עם חריץ אנכי במזוזה הימנית) — ~ עקבית עם דיור יהודי כפרי מזרח-אירופי מהתקופה.
אישים: שתי דמויות, לא מזוהות. המבוגר בערך בן 35–45; הילד בערך בן 6–8.
קונטקסט היסטורי: אם המיקום במזרח אירופה הכבוש (עקבי עם הרמזים הוויזואליים לעיל), התקופה 1941–1943 ראתה גירושים המוניים של קהילות יהודיות כפריות בכל האזור. אין אירוע ספציפי שניתן לזיהוי מהתצלום הזה לבדו.
הערות: אין כיתוב על התצלום עצמו; גב התצלום לא נצפה. זיהוי יכול להרוויח מהשוואה לארכיוני משפחה אזוריים ולרישומי מוסרים, אם זמינים.

הרשומה ניתנת לפרסום כפי שהיא. היא לא טוענת יתר על המידה. היא לא טוענת מתחת לסף. היא ניתנת לביקורת. וקריטית — היא משאירה מקום לחוקר עם הקשר נוסף להאריך אותה, מבלי שיצטרך קודם לפרק ניחוש בטוח.

למה זה חשוב עכשיו

ארכיוני שואה ויזואליים עוברים דיגיטציה מהר יותר משהם מקוטלגים. רוב פרויקטי הדיגיטציה מפיקים סריקות ברזולוציה גבוהה אבל מטא-דאטה מובנה מינימלי. כלי AI מיושמים כדי לסגור את הפער — ורבים מהם מפיקים רשומות קטלוג שמהזות שמות על פנים לא מזוהות, מיקומים על נופי רחוב גנריים, תאריכים על תמונות לא מתוארכות.

ארכיון מזוהם בזיהויים הזויים קשה יותר לשימוש מארכיון ללא זיהויים כלל. המסגרת התלת-שכבתית, עם סמני ביטחון מפורשים, מאפשרת ל-AI לעזור בשכבות שבהן הוא באמת יכול לעזור (ויזואלי, חפצים, לעיתים קונטקסט) ולהיכנע איפה שהוא חייב (אישים, אירועים ספציפיים). מה שיוצא הוא רשומת קטלוג שהיסטוריונים עתידיים יכולים לבנות עליה במקום להיאבק בה.

העבר לא נעשה נגיש יותר על-ידי כך שעושים אותו בטוח יותר. הוא נעשה נגיש יותר על-ידי כך שעושים אותו כן יותר.