יום רביעי, 31 במרץ 2010

ידיעות חדשותיות ייכתבו על ידי מחשב


האם את הכתבה הבאה שתקראו יכתוב מחשב?
מאת אסף שטול-טראורינג, כתב "הארץ" לענייני מדע
אתרים בארה"ב מפתחים אלגוריתם שמכין ידיעות חדשותיות מבלי מגע יד אדם
העיתונאים הלכו הביתה, רק המחשבים נשארו
תצלום: רויטרס המתמטיקאי אלן טורינג הציע ב-1950 מבחן פשוט שאמור לבדוק אם למכונה נתונה יש בינה מלאכותית: אדם המשמש שופט מנהל דיאלוג עם שני גורמים המוסתרים מעיניו: האחד המכונה העומדת למבחן והשני אדם מן השורה. אם השופט אינו יכול לקבוע מיהו האדם ומי המכונה, הרי שלמכונה בינה מלאכותית. רוב החוקרים מעריכים כי עוד ארוכה הדרך עד ליצירת מכונה שתעבור את מבחן טורינג בהצלחה. אולם יש הטוענים כי מחשבים מודרניים יצליחו לעבור ניסוי דומה - נקרא לו "מבחן טורינג העיתונאי" - כבר בעתיד הנראה לעין. מתכנתים אמריקאים מפתחים בימים אלה מודלים אלגוריתמיים לייצור ידיעות עיתונאיות; הם מקווים שבעתיד הקרוב לא יוכלו הקוראים-שופטים להבחין בהבדל בין ידיעות אלה לבין תוכן פרי מקלדתם של עיתונאים בשר ודם. בינתיים, העלבון שמור לכתבי הספורט בלבד. אתר הספורט האמריקאי StatSheet.com הודיע לפני כמה ימים כי בכוונתו להפיק באופן אוטומטי ידיעות העוסקות במשחקי ספורט, באמצעות מודלים אלגוריתמיים. מטרתו המוצהרת של האתר היא כי לפחות 90% מהקוראים לא יוכלו להבדיל בין הידיעות שנכתבו על ידי כתבים לבין הידיעות ש"נכתבו" על ידי האלגוריתם. המיזם של האתר צפוי לפעול בדומה למודל לייצור תוכן אוטומטי שפיתחה מעבדת Intelligent Information באוניברסיטת נורת'ווסטרן בארה"ב, בשיתוף פעולה עם בית הספר לעיתונות של האוניברסיטה. תוכנה שפיתחה המעבדה, הקרויה StatsMonkey, מייצרת באופן אוטומטי ידיעות ספורט מנתוני משחקים שמוזנים אליה. התוכנה אינה מחליפה רק את הכתב, אלא גם את העורך: לידיעה מצורפת כותרת מתאימה ותצלום של השחקן המרכזי במשחק. התוכנה, שמוגבלת כיום ליצירת ידיעות העוסקות במשחקי ספורט, בנויה על מודלים סטטיסטיים שמאפשרים את זיהויו של המידע החדש והחשוב ביותר בתוצאות משחק זה או אחר: התוכנה סורקת אחר שינויים בין תוצאות המשחק לתוצאות קודמות והסתברויות ניצחון. גם הפעולות והשחקנים המרכזיים במשחק מזוהים בצורה דומה. למערכת הממוחשבת ארכיון הכולל את הסוגים השונים של העלילות או הסיפורים שעשויים להיות לידיעה, כגון ניצחון שהושג בדקה ה-90 או תבוסה מוחצת של אחת הקבוצות. לטענת מפתחי התוכנה, ביכולתה אף לדווח על משחק מנקודת המבט של שתי הקבוצות המשחקות; קוראים המתלוננים על חוסר אובייקטיביות בדפי הספורט יראו בכך יתרון גדול. מטבע הדברים, הפיתוח מוגבל כעת לידיעות עשירות בנתונים, כגון אלה הנפוצות בעיתוני הספורט והכלכלה. מפתחי StatsMonkey מדגישים כי התוכנה אינה נועדה להחליף את העיתונאי, אלא להקל על עבודתו. "התוכנה יודעת איך והיכן למצוא מידע ונתונים, אך בסופו של דבר יהיה זה העיתונאי שיצטרך לתת את נקודת המבט האישית שלו לסיפור", אמרה לגרדיאן כריסטין המונד מאוניברסיטת נורת'ווסטרן, "זה רק יעניק לעיתונאים עמדת פתיחה לעבוד איתה". כך מסר מחשבנו לענייני ספורטהקטע הבא, המתאר משחק בייסבול בליגת המכללות האמריקאית, נכתב במלואו באמצעות אלגוריתם (ותורגם על ידי מתרגם בשר ודם): "המגיש טוני בוצ'יפרו נשא על כתפיו את נבחרת הבייסבול של מישיגן סטייט ספרטנס ביום ראשון, והוביל אותה לניצחון 3-0 על נוטרדאם פייטינג אייריש (11-7) באצטדיון פרנק אק. בוצ'יפרו מנע מהפייטינג אייריש להשיג נקודות כלשהן בתשעת הסיבובים שבהם השתתף (12-4). הוא פסל חמישה חובטים ואפשר רק הליכה אחת ושלוש חבטות. משחקה הבא של מישיגן ייערך ב-26 במארס, באוקלנד".