Artificial Intelligence for Calligraphic Writer Identification: The Case of Lope de Vega’s Autographs

Autores/as

DOI:

https://doi.org/10.13035/H.2025.13.01.36

Resumen

This paper presents a computational approach for detecting the calligraphic footprint of a scribe in a large documentary corpus. The system leverages advances in HTR (Handwritten Text Recognition) techniques, usually employed for automatic transcription, but on this occasion used to locate the specific handwriting of interest when dealing with an extensive collection of texts, in which there may be dozens or even hundreds of different hands. We conducted a control experiment with Lope de Vega (a renowned 17th-century Spanish playwright) and the Transkribus platform (user-friendly for researchers who are not computer specialists), obtaining very accurate results: once trained on Lope’s hand and on two hundred other distinct hands, the system can single out Lope’s handwriting in documents beyond the mod el, with high success rates (accuracy, precision, recall, and F1 scores in the range of 0.95-1.00). These findings pave the way for training models for hands of particular interest (authors, censors, copyists, bureaucrats, actors, etc.) and systematically scanning extant documents in order to detect other instances in which they participated, which could lead to discoveries of historical, literary, and patrimonial significance.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Antonucci, Fausta, «Una nueva herramienta para el estudio del teatro clásico español: Calderón Digital. Base de datos, argumentos y motivos del teatro de Calderón», Bulletin of the Comediantes, 70.1, 2018, pp. 79-95.

Arellano, Ignacio, «Calderón en su taller: algunas intervenciones en los autógrafos de los autos sacramentales», Anuario Calderoniano, 8, 2015, pp. 31-52.

Ayuso García, Manuel, «Las ediciones de Arnao Guillén de Brocar de BECLaR transcritas con ayuda de Transkribus y OCR4all: creación de un modelo para la red neuronal y posible explotación de los resultados», Historias Fingidas, número especial 1: Humanidades Digitales y estudios literarios hispánicos, 2022, pp. 151-173.

Bazzaco, Stefano, «El reconocimiento automático de textos en letra gótica del Siglo de Oro: creación de un modelo HTR basado en libros de caballerías del siglo XVI en la plataforma Transkribus», Janus. Estudios sobre el Siglo de Oro, 9, 2020, pp. 534-561.

Bazzaco, Stefano, Ana Milagros Jiménez Ruiz, Mónica Martín Molares and Ángela Torralba Ruberte, «Sistemas de reconocimiento de textos e impresos hispánicos de la Edad Moderna: la creación de unos modelos de HTR para la transcripción automatizada de documentos en gótica y redonda (s. XV-XVII)», Historias Fingidas, número especial 1: Humanidades Digitales y estudios literarios hispánicos, 2022, pp. 67-125.

Blasut, Giada, «Los modelos de HTR Silves1549_BNE y Spanish Gothic como herramientas de la labor ecdótica», Historias Fingidas, número especial 1: Humanidades Digitales y estudios literarios hispánicos, 2022, pp. 175-193.

Boadas, Sònia (coord.), Redescubriendo los manuscritos autógrafos de Lope de Vega, Criticón, 142, 2021.

Boadas, Sònia, and Marco Presotto (dirs.), AUTESO (Autógrafos Teatrales del Siglo de Oro), 2024. https://theatheor-fe.netseven.it/

Camps, Jean Baptiste, Chahan Vidal-Gorène and Marguerite Vernet, «Handling Heavily Abbreviated Manuscripts: HTR Engines vs Text Normalization Approaches», International Conference on Document Analysis and Recognition 2021, 2021, pp. 306-316, hal-03279602f. https://doi.org/10.48550/arXiv.2107.03450

Clérice, Thibault, «Ground-truth Free Evaluation of HTR on Old French and Latin Medieval Literary Manuscripts», Computational Humanities Research Conference (CHR) 2022, 2022, hal-03828529. permanente al artículo: https://enc.hal.science/hal-03828529v1

Couture, Beatrice, Farah Verret, Maxime Gohier and Dominique Deslandres, «The Challenges of HTR Model Training: Feedback from the Project Donner le gout de lʼarchive à lʼère numérique», Journal of Data Mining & Digital Humanities, 2023, s. p. https://doi.org/10.46298/jdmdh.10542

Crivellari, Daniele, Marcas autoriales de segmentación en las comedias autógrafas de Lope de Vega: estudio y análisis, Kassel, Edition Reichenberger, 2013.

Crivellari, Daniele, «Sobre un manuscrito autógrafo de Lope: Barlaán y Josafat», Revista de Literatura, 77, 153, 2015, pp. 75-91.

Cuéllar, Álvaro, «La Inteligencia Artificial al rescate del Siglo de Oro. Transcripción y modernización automática de mil trescientos impresos y manuscritos teatrales», Hipogrifo. Revista de literatura y cultura del Siglo de Oro, 11.1, 2023, pp. 101-115. https://doi.org/10.13035/H.2023.11.01.08

Cuenca, Paloma, «El favor agradecido, ¿un manuscrito autógrafo?», Criticón, 142, 2021, pp. 47-63.

Fradejas Rueda, José Manuel, «De editor analógico a editor digital», Historias Fingidas, número especial 1: Humanidades Digitales y estudios literarios hispánicos, 2022, pp. 39-65.

Greer, Margaret R., and Alejandro García-Reidy (dirs.), Manos. Base de datos de manuscritos teatrales áureos, 2022. http://www.manos.net

Hawk, Brandon W., Antonia Karaisl and Nick White, «Modelling Medieval Hands: Practical OCR for Caroline Minuscule», DHQ: Digital Humanities Quarterly, 13.1, 2019, s. p. https://www.digitalhumanities.org/dhq/vol/13/1/000412/000412.html

Hernando Morata, Isabel, «Marcas autoriales en los manuscritos autógrafos de Calderón», Criticón, 124, 2015, pp. 185-202.

Iglesias Feijoo, Luis, «Calderón, del autógrafo a la imprenta», in Antes se agota la mano y la pluma que su historia. Magis deficit manus et calamus quam eius hystoria. Homenaje a Carlos Alvar, ed. Constance Carta, Sarah Finci and Dora Mancheva, San Millán de la Cogolla, Cilengua, 2016, vol. 2, pp. 1451-1468.

Kroll, Simon, Las comedias autógrafas de Calderón de la Barca y su proceso de escritura, Frankfurt am Main, Peter Lang, 2017.

Menéndez Pelayo, Marcelino, Epistolario, en Biblioteca Virtual Ignacio Larramendi de Polígrafos, vol. XVII, junio 1903-diciembre 1904. https://www.larramendi.es/es/corpus/unidad.do?idCorpus=1002&idUnidad=1002

Muehlberger, Guenter, et al., «Transforming Scholarship in the Archives through Handwritten Text Recognition: Transkribus as a Case Study», Journal of Documentation, 75.5, 2019, pp. 954-976.

Oleza, Joan, et al., Artelope. Base de datos y argumentos del teatro de Lope de Vega, 2011-2021. https://artelope.uv.es/

Pinche, Ariane, «CREMMALab Project: Handwritten Text Recognition (HTR) for Medieval manuscripts», Digital Humanities 2022, Tokyo, Japan, 2022, hal03719504. https://doi.org/10.46298/jdmdh.10252

Presotto, Marco, Le commedie autografe di Lope de Vega. Catalogo e studio, Kassel, Edition Reichenberger, 2000.

Puigcerver, Joan, and Carlos Mocholí, PyLaia, 2018. https://github.com/jpuigcerver/PyLaia

Sánchez, Joan Andreu, Vicent Bosch, Verónica Romero, Katrien Depuydt and Jesse de Does, «Handwritten Text Recognition for Historical Documents in the Transcriptorium Project», Proceedings of the First International Conference on Digital Access to Textual Cultural Heritage, 2014, pp. 111-117. https://dl.acm.org/doi/10.1145/2595188.2595193

Sánchez Mariana, Manuel, «Los autógrafos de Lope de Vega», Manuscrt.Cao, 10, 2011, s. p. https://dialnet.unirioja.es/servlet/articulo?codigo=3906463

Souibgui, Mohamed Ali, Asma Bensalah, Jialuo Chen, Alicia Fornés and Michelle Waldispühl, «A User Perspective on HTR Methods for the Automatic Transcription of Rare Scripts: The Case of Codex Runicus», ACM Journal on Computing and Cultural Heritage, 15.4, 2023, pp. 1-18.

Ströbel, Phillip Benjamin, Simon Clematide, Martin Volk, and Tobias Hodel, «Transformer-based HTR for historical documents», arXiv preprint, 2022. https://doi.org/10.48550/arXiv.2203.11008

Terras, Melissa, «The Role of the Library when Computers Can Read: Critically Adopting Handwritten Text Recognition (HTR) Technologies to Support Research», The Rise of AI: Implications and Applications of Artificial Intelligence in Academic Libraries, 2022, pp. 137-148. https://www.research.ed.ac.uk/en/publications/the-role-of-the-library-when-computers-can-read-critically-adopti

Descargas

Publicado

2025-06-07 — Actualizado el 2025-06-07

Versiones

Número

Sección

Artículos