Наука та технологіїТехнології

Штучний інтелект навчили читати середньовічні манускрипти

20:37 20 лют 2019.  665Читайте на: УКРРУС

Оцифровувати безцінні рукописи з далекого минулого допомагає проста в застосуванні «розумна» система.

Тірольський Державний архів в Інсбруку зберігає безліч документів. Деякі з них датовані XI століттям. Перетворити ці книги в електронний вигляд – завдання не з простих. Але цей архів працює з вченими над автоматизацією оптичного розпізнавання текстів із використанням новітніх комп'ютерних технологій. 

Як повідомляє Еuronews, для оцифровування таких книг вчені, що працюють над європейським дослідницьким проектом READ, розробили просту в застосуванні систему. В її основі – спеціальний додаток для смартфонів. Він спрацьовує, коли сторінки перевертаються, і автоматично робить фотографії кожної з них.

«Це поєднання низькотехнологічних методів і новітніх технологій. Цей навіс – відносно простий, низькотехнологічний аксесуар. Але він працює з високотехнологічним додатком, встановленим на смартфоні. Пристрій підключений до платформи «Транскрібус». Додаток завантажує зображення на сервер. А він, своєю чергою, розпізнає рукописний текст», – пояснює Гюнтер Мюльбергер, координатор проекту READ, дослідник в області оцифровування. 

«Транскрібус» значно спрощує завдання, на виконання яких зазвичай йдуть роки, допомагаючи вченим у роботі зі складним почерком і незвичайними макетами.

Підписуйтеcь на наш Telegram-канал Lenta.UA - ЄДИНІ незалежні новини про події в Україні та світі

«Перевага цієї технології полягає в тому, що вона забезпечує зв'язок між зображенням і текстом і робить це дуже простим способом. Так, розшифрувальник отримує повну картину. Це дозволяє звести кількість помилок до мінімуму. Будь-яким іншим способом такого результату досягти не можна», – запевняє Маріо Кларер, професор літератури та історії культури Інсбрукського університету. 

Сервер, що знаходиться в університеті, використовує спеціальні алгоритми машинного навчання для того, щоб комп'ютер міг працювати з новими шрифтами. Після того як користувачі вводять у комп'ютер частину манускрипту вручну, ПЗ самостійно ідентифікує нові символи, а потім завершує розшифровування решти тексту, роблячи це з точністю, що перевищує 95%. 

Ця система здатна розшифрувати текст на будь-якій мові. Вона об'єднує лінгвістів, вчених, архівістів і волонтерів із багатьох країн. Розробники планують зробити «Транскрібус» комерційно доступним для користувачів по всьому світу.

Найпопулярніше