הנשק הסודי של OCR: איך מילון תחום משדרג זיהוי טקסט
מילון תחום הופך ניחוש OCR להחלטה מושכלת. כיצד לבנות אוצר מילים תחומי שמשדרג זיהוי כתב יד עברי — ומתי הוא דווקא עלול להזיק.
קרא מאמר ←עדכונים מהמפגש שבין היסטוריה ואינטליגנציה מלאכותית.
מילון תחום הופך ניחוש OCR להחלטה מושכלת. כיצד לבנות אוצר מילים תחומי שמשדרג זיהוי כתב יד עברי — ומתי הוא דווקא עלול להזיק.
קרא מאמר ←מספר דיוק בלי קליברציה הוא בלוף. כיצד ניקוד ביטחון וסף נכון העלו את הדיוק בזיהוי כתב יד עברי מ-56% ל-90% — בלי לאמן מודל חדש.
קרא מאמר ←מה אפשר ומה לא אפשר עם AI במחקר שורשים יהודיים: OCR לעברית ויידיש, RAG על אלפי מסמכים, סוכני מחקר, עלויות אמיתיות, ושגיאות שהורסות פרויקטים.
קרא מאמר ←מסגרת תלת-שכבתית לקטלוג תצלומים היסטוריים מתקופת השואה בעזרת AI: ויזואלי, חפצים, ואישים — עם סמני ביטחון מפורשים ✓ ~ ? והדיסציפלינה של מתי להימנע מזיהוי.
קרא מאמר ←איזה מנוע OCR מנצח על כתב רבני, רש״י, יידיש או לאדינו? מספרי דיוק, תהליך אימון, והטעויות שהורסות פרויקטי דיגיטציה.
קרא מאמר ←מילון עבודה למונחים הטכניים שמלווים את AI במחקר היסטורי: OCR, HTR, RAG, embeddings, גרפי ידע, NER, פנקסי קהילה, ספרי יזכור ועוד 25 ערכים מוסברים בשפה ברורה.
קרא מאמר ←
בנינו מאגר מידע מובנה שריכז עשרות סוגי מקורות — עיתונות, דיפלומטיה, יומנים, פרוטוקולים — משנה אחת מכרעת, חיפושי וניתן לניתוח.
קרא מאמר ←כיצד שילוב מחקר ארכיוני עם AI הפך כתב יד זיכרונות של מאות עמודים למהדורה מדעית עם מאות הערות שוליים — בתוך חודשים ולא שנים.
קרא מאמר ←כיצד השתמשנו ב-OCR ובסוכני מחקר מבוססי AI כדי להפוך אלפי עמודי עיתונות היסטורית לבסיס נתונים חיפושי — וחשפנו ציטוטים נשכחים.
קרא מאמר ←כיצד השתמשנו ב-LLM ובסוכני מחקר כדי להמיר עשרות זיכרונות משפחתיים לסיפור היסטורי אחד — לאמת עובדות ולחשוף קשרים חבויים.
קרא מאמר ←כיצד סוכני מחקר מבוססי AI פועלים במקביל על עשרות מקורות ושחזרו אירוע היסטורי שנמחק כמעט לגמרי מהתיעוד — מקרה בוחן.
קרא מאמר ←כיצד בינה מלאכותית מסייעת לחוקרים לחשוף, להצליב ולשמר עדויות ומסמכים מתקופת השואה בהיקף חסר תקדים.
קרא מאמר ←OCR מסורתי אינו מסוגל לקרוא מסמכים בכתב יד. טכנולוגיית HTR מבוססת למידה עמוקה סוף סוף הופכת מאות שנות רשומות בכתב יד לחפישות.
קרא מאמר ←כיצד AI משנה את עבודת הארכיון — ממדפים של תמונות פסיביות לארכיון חכם שיודע לענות על שאלות מורכבות. שלוש שכבות של ארכיון מבוסס-AI, עם דוגמה קונקרטית מהשטח.
קרא מאמר ←מסמכים בודדים מספרים שברי סיפורים. גרפי ידע מחברים אותם לרשתות של אנשים, מקומות ואירועים — וחושפים דפוסים בלתי נראים למחקר מסורתי.
קרא מאמר ←איך חוקרים שואלים אלפי מסמכים היסטוריים בשפה טבעית — עם ציטוט מקורות. הגדרה, עלויות, ואיפה RAG עדיין נכשל.
קרא מאמר ←מוזיאונים, ארכיונים וספריות מתמודדים עם מירוץ דחוף נגד הזמן. שימור דיגיטלי מבוסס AI מציע כלים חדשים להגנה על מורשת תרבותית לדורות הבאים.
קרא מאמר ←סוכני מחקר אוטונומיים מבוססי AI מסוגלים כעת לבצע מחקר היסטורי ראשוני במספר ארכיונים בו-זמנית. כך הם משנים את העבודה האקדמית.
קרא מאמר ←גלו כיצד בינה מלאכותית מחוללת מהפכה במחקר היסטוריה משפחתית, מפענוח מכתבים ישנים ועד חיבור רשומות מפוזרות מרחבי היבשות.
קרא מאמר ←OCR מהמדף נכשל על עברית היסטורית. הנה תהליך ה-AI שארכיונאים וחוקרים משתמשים בו לשחזור כתבי יד, כתב רש״י ועמודים בלויים.
קרא מאמר ←