Изкуствен интелект може най-накрая да разкодира Ръкописа на Войнич

Ивайло Красимиров

30 януари 2018 г. в 10:45
Последно: 19 юни 2024 г. в 10:21

От векове Ръкописа на Войнич е книгата, която хората не разбират. Сега обаче най-после може да имаме шанса да я прочетем – благодарение на машина, изобретена повече от половин хилядолетие по-късно.

Ръкописа на Войнич често е наричан най-мистериозната книга на света. Тя се състои от 240 страници криптиран текст, изписан на странен, неизвестен език, придружен със странни диаграми и илюстрации.

Дори има сгъваеми страници, което се смята за крайно необичайно за средновековен том, датиран от ранния 15 век.

(Beinecke Rare Book & Manuscript Library)

Проблемът е, че никой няма представа за какво се отнася всичко това, което е в книгата. Значението на текста представлява предизвикателство за въображението на човека от векове.

Книгата е била притежавана от алхимици и императори, преди да се появи в по-ново време в началото на 20 век като собственост на полския антиквар Вилфрид Войнич, откъдето идва и имета но ръкописа.

Оттогава досега многобройни криптографи, разбивачи на код и лингвисти са се опитвали да разкрият тайната на Ръкописа на Войнич, но кодът в странците, заедно със странните рисунки на растения, символи и къпещи се жени оставаха без обяснение.

Сега, благодарение на канадски учени, изглежда имаме нова следа по случая.

Изследователи от Университета в Албърта са използвали изкуствен интелект, за да декодират части от древния ръкопис, използвайки техника наречена алгоритмично дешифриране.

Това не е било лесно, обяснява екипът в своята статия, като се има предвид броят на неизвестните в „уравнението“.

„Ръкописа на Войнич е написан на непознат код, който кодира непознат език“, пишат авторите, „което представлява най-предизвикателната задача в проблем по дешифриране.“

Тествайки своя алгоритъм върху 380 различни превода на Декларацията за универсални човешки права, учените са установили, че тяхната система успява безпогрешно да посочи оригиналния език в 97% от случаите.

(Beinecke Rare Book & Manuscript Library)

След това те фокусирали усилията на изкуствения интелект върху Ръкописа на Войнич, подозирайки че е написан на арабски. Изкуственият интелект обаче не се съгласил с това подозрение, давайки индикации, че иврит е най-вероятният изходен език, скрит зад кода (заедно с още някои нетипични за средните векове възможности).

Тогава учените изградили хипотеза, че шифърът върху иврит може да е пример за подредена по азбучен ред анаграма (наречена алфаграма), която пренарежда буквите в думите, докато пропуска гласните.

Опитите за разкодиране на първите 10 страници от текста с помощта на изкуствения интелект довели до смесени резултати.

„Оказа се, че 80% от думите са в речника по иврит, но ние не знаехме дали те заедно дават някакъв смисъл“, казва Грег Кондрак, компютърен лингвист и член на екипа.

(Beinecke Rare Book & Manuscript Library)

Те нямали подходящ учен, който да валидира откритието им. Експериментите с Google Translate предполагали досещане и наместване, но дори те показвали, че има съвпадения с текста.

В началото на главата за „Билки“ в Ръкописа на Войнич, която съдържа рисунки на различни видове растения, се появяват много термини, свързани с ботаниката, включително думите „фермер“, „светлина“, „въздух“ и „огън.“

Съвпадение? Може би не.

„Тя направи препоръки на свещеника, стопанина на къщата, към мен и други хора“ (She made recommendations to the priest, man of the house and me and people), са първите думи в Ръкописа на Войнич, според изкуствения интелект.

Препоръки за отглеждане на билки и ботаника, може би? Екипът казва, че още не можем да сме сигурни.
„Започва с изречение, което има граматика и може да се преведе“, казва Кондрак. „Странно изречение за начало на ръкопис, но определено има смисъл.“

Сега екипът казва, че има нужда от съдействието на експерти по древна юдейска история, които да продължат дешифрирането и да потвърдят, че алгоритъмът не е интерпретирал погрешно текста.

„Резултатите, които представяме на този етап може да се интерпретират или като улики, че именно иврит е изходния език в кодирането, или като артефакти за комбинативната сила на анаграмите и езиковите модели“, пишат те.

„Във всеки случай алгоритмичното дешифриране може да е добра начална точка за учени с експертиза в дадения език и исторически период.“

Като се има предвид, колко много още не знаем, това може да е вълнуваща нова улика за по-нататъшни разследвания на този древен пъзел.

Откритията са публикувани в Transactions of the Association of Computational Linguistics.

Ако намирате тази публикация за интересна, моля споделете я.