Никога не съди за книгата по корицата … или пък не?
Кориците на книгите обикновено се стремят да визуализират съдържанието. Това всъщност не е точно в синхрон с известната поговорка да не се съди за книга по корицата й. Сега двама изследователи от Университета Киушу в Япония решили да проверят доколко изкуствен интелект може адекватно да преценява съдържанието на книгите. Изглежда невронните мрежи се справят доста добре.
Задачата била проста: може ли дълбока невронна мрежа, която има четири слоя с по 512 неврона всеки, коректно да разбере към кой жанр принадлежи книгата, чрез анализ единствено на нейната корица?
Брайан Кенджи и Сейичи Учида свалили 137 788 уникални корици на книги от 20 различни жанра от Amazon.com. Те тренирали невронната мрежа, използвайки 80% от тези данни, да разпознава жанра само по корицата. За да валидират модела, използвали 10 на сто повече от набора данни. Останалите 10% били използвани за проверка на невронната мрежа.
Според изследването, алгоритъмът на изкуствения интелект изкарвал по три възможни жанра за всяка книга. Резултатите показали „точност от 21,9% за номер 1, 32,1% за номер 2 и 40,2% за номер 3 в 20 степенната жанрова класификация.“ Това е много по-висока точност от случаен резултат.
Системата, разбира се, не била перфектна. Ограничения, свързани с разпознаването на снимки и двусмислия в самите корици направили трудна категоризацията на някои книги. Имало затруднения с биографии и мемоари, медицински и научни книги, както и с детски книги, които са били обърквани с комикси или графични новели. Учените също така не са проверили още как тяхната невронна мрежа се справя в сравнение с действителен човек, който преценява по корицата.
Но както всяка невронна мрежа и тук, колкото повече данни получава системата, толкова по-добре се представя в преценката. Японските учени вярват, че изкуственият интелект дори може да бъде обучен да създава дизайна на кориците на книгите, без човешка намеса. Илюстраторите по-добре да внимават.