Für osmanische Archive und Ressourcen wurde eine von künstlicher Intelligenz unterstützte Analyse entwickelt.

By admin On 5. Dezember 2022

Eine auf künstlicher Intelligenz basierende Analyse kommt von den Akademikern unseres Landes, um die osmanischen Archive und Ressourcen, die eines der größten Probleme in den Sozialwissenschaften darstellen, auf das heutige Türkisch zu übertragen. Das vom Doktoranden İshak Dölek der Universität Istanbul-Cerrahpaşa mit seinem Betreuer entwickelte Projekt wurde in das Förderprogramm TÜBİTAK 1512 aufgenommen. Das Projekt, das ebenfalls auf KOSGEB basierte, wurde mit der fertigen OCR-Anwendung in ein Unternehmen umgewandelt.

Die Akademiker unseres Landes übertragen osmanische Quellen mit künstlicher Intelligenz in das heutige Türkisch. Assoziierter Professor an der Abteilung für Computertechnik der Universität Istanbul-Cerrahpaşa. DR. Unter der Leitung von Atakan KURT, Dr. Das heimische Unternehmen Osmanlica.com, das als Doktorarbeitsprojekt von İshak DÖLEK begann, erzielte einen Erfolg von 96 Prozent im osmanischen OCR-Prozess, der den ersten Schritt bei der Übertragung osmanischer Ressourcen in das heutige Türkisch darstellt.

Sie lösen den osmanisch-türkischen Transfer in 3 Schritten: 1- OCR 2- Alphabetische Übersetzung 3- Sprachübersetzung

„Osmanlica.com: Artificial Intelligence Based Ottoman-Turkish End-to-End Transmission“, das als Doktorarbeit mit dem Ziel begann, alle Arten von Ressourcen in osmanischen Archiven und Bibliotheken in drei Schritten ins heutige Türkisch zu übertragen: Ottoman OCR, Ottoman -Übersetzung des türkischen Alphabets und der osmanisch-türkischen Sprachübersetzung Das Projekt wurde später von Entertech Teknokent A.Ş auf dem Avcılar Campus durchgeführt. wurde in das Unternehmensunterstützungsprogramm TÜBİTAK 1512 aufgenommen. Bestatter Mina ARGE Bilişim Ltd. Sti. und sie entwickelten das OCR-Projekt, das den ersten Schritt des Projekts darstellt. Nach dem erfolgreichen Abschluss des OCR-Projekts entwickelt die Mina ARGE auf der Grundlage von KOSGEB und TÜBİTAK weiterhin das Projekt zur Übersetzung des osmanisch-türkischen Alphabets, das eine Fortsetzung dieses Projekts darstellt. Das Unternehmen, das in seinem Alphabetübersetzungsprojekt bereits eine Genauigkeit von 75 % erreicht hat, setzt seine F&E-Aktivitäten mit einem Cluster aus Computern, Sprachen, Literatur und Historikern fort, um in dieser Anwendung eine Genauigkeitsrate von 95 % zu erreichen.

96 % Erfolg bei OCR in osmanischem Türkisch erzielt

Assoz. DR. Atakan KURT gab folgende Erklärung ab: „Es gibt Hunderttausende von osmanischen Büchern, Zeitungen, Zeitschriften und Dokumenten in Staatsarchiven, Bibliotheken und Privatsammlungen im In- und Ausland. Es ist praktisch unmöglich, so viele Dokumente manuell von Menschenhand ins Türkische zu übersetzen. In letzter Zeit wurden große Fortschritte in den Informationstechnologien und der künstlichen Intelligenz erzielt. Auf diese Weise können Probleme, die bisher nicht gelöst werden konnten, im Lichte neuer Entwicklungen gelöst werden. Wir passen diese neuen Technologien an, um die Dokumente in osmanischen Archiven und Bibliotheken ins heutige Türkisch zu übertragen. Wir haben bedeutende Erfolge in den Phasen OCR und Transliteration erzielt. Dieses Problem, das in den westlichen Ländern weitgehend gelöst wurde, ist in unserem Land jetzt nicht gelöst. Unser Ziel ist es, osmanische Bücher, Zeitschriften, Zeitungen und Archivdokumente ins heutige Türkisch zu übersetzen, damit sie von einfachen Menschen und insbesondere der neuen Generation gelesen und verstanden werden können; und die notwendige Software zu entwickeln, um die Geschichte zu beleuchten, indem Dokumente ausgegraben werden, die wahrscheinlich noch nie untersucht oder gelesen wurden. Unserer Meinung nach ist dieses Projekt ein Anwärter darauf, das Visionsprojekt der Türkei in den Sozialwissenschaften zu werden. Mit diesem Projekt können Hunderttausende von Büchern, Zeitschriften, Zeitungen und Millionen von Archivdokumenten in schneller Form ins heutige Türkisch übertragen werden.“

Bei der Übersetzung des osmanisch-türkischen Alphabets wurde eine Genauigkeitsrate von 75 % erreicht

Dr. İshak DÖLEK hingegen sagte, dass „zusätzlich zum osmanischen OCR-Prozess die Arbeit an anderen Projekten wie der Übersetzung des osmanischen Alphabets ins Türkische, der Sprachübersetzung vom Osmanischen ins zeitgenössische Türkisch und der Rika-OCR fortgesetzt wird Umwandlung der osmanischen Handschrift von Foto in Text mit OCR.“ „Zum Beispiel haben wir eine Genauigkeitsrate von 75 % bei der Übersetzung eines osmanischen Textes aus dem auf Arabisch basierenden osmanischen Alphabet in ein auf Latein basierendes türkisches Alphabet erreicht. Unsere Alphabet-Übersetzungsanwendung ist immer noch die einzige Anwendung, die im Internet bereitgestellt wird.“

Sie testeten die alphabetische Übersetzung mit einem Wissensset von 3.000 Wörtern und 23.000 Buchstaben

DR. İshak DÖLEK fuhr mit seiner Aussage fort: „Wir haben 96 Prozent Erfolg in der OCR-Anwendung erzielt, die mit einem einzigartigen osmanischen Informationssatz getestet wurde, der aus 21 Seiten, 3.000 Wörtern und 23.000 Buchstaben an der Grenze des osmanischen Nesih besteht. Mit anderen Worten, 96 von 100 Buchstaben wurden von der Anwendung als richtig erkannt, was die höchste jemals erreichte Genauigkeitsrate ist. In diesen Tests haben wir unsere Anwendung mit fünf verschiedenen OCR-Anwendungen verglichen, von denen vier aus dem Ausland und eine aus der Türkei stammten, und wir haben die Ergebnisse in Form eines Papiers auf einer internationalen Konferenz und eines Artikels in einer Zeitschrift veröffentlicht. Wir freuen uns über den Beitrag, den unsere Praxis, in der wir unsere F&E-Aktivitäten fortsetzen, in den Sozialwissenschaften leisten wird. Mehr als 20.000 Benutzer haben unsere OCR-Anwendung auf Osmanlica.com ausprobiert, und mehr als 100.000 Benutzer haben unsere Alphabet-Übersetzungsanwendung bisher ausprobiert. Diese Zahlen steigen täglich weiter an. Diese Situation motiviert uns noch mehr.“

DE B2Press