Sobre la validez de los análisis cuantitativos en los estudios de autoría de textos breves: el caso particular de los entremeses del Siglo de Oro

Autores/as

DOI:

https://doi.org/10.24197/ogigia.33.2023.69-96

Palabras clave:

atribución de autoría, entremeses, Siglo de Oro, análisis cuantitativos, idiolecto

Resumen

Ante las afirmaciones de varios especialistas que declaran la dificultad de aplicar análisis cuantitativos a los estudios de atribución de autoría de textos literarios breves, inferiores a las 2000-2500 palabras, en este trabajo proponemos un diseño experimental basado en la autoría de una serie de entremeses del Siglo de Oro español, con el objetivo de establecer si dicho umbral es realmente determinante para este género literario o no. Los análisis nos permitirán estudiar, asimismo, si la señal autorial o el vehículo de expresión (prosa/verso) también condicionan la fiabilidad de los resultados.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Arellano, Ignacio y Celsa Carmen García-Valdés (1997), “El Entremés el marido pantasma, de Quevedo”, La Perinola, 1, pp. 41-68.

Argamon, Shlomo (2008), “Interpreting Burrows’s Delta: Geometric and probabilistic foundations”, Literary and Linguistic Computing, 23 (2), pp. 131-147.

Asensio, Eugenio (1971), Itinerario del entremés, desde Lope de Rueda a Quiñones de Benavente con cinco entremeses inéditos de D. Francisco de Quevedo, Madrid, Gredos, 2ª edición revisada.

Blasco, Javier (2016), “Avellaneda desde la estilometría”, en Pedro Ruiz Pérez (ed.), Cervantes: los viajes y los días, Madrid, Sial Ediciones, pp. 97-116.

Blasco, Javier (2019a), “Atribuciones cervantinas desde la estilometría. El entremés de Los mirones”, en Guillermo Laín Corona, Rocío Santiago Nogales y José Romera Castillo (coords.), Cartografía teatral en homenaje al profesor José Romera Castillo, Madrid, Visor Libros, pp. 151-168.

Blasco, Javier (2019b), “La graciosa y gratuita disputa sobre la autoría de la Historia verdadera del inconfundible Bernal Díaz del Castillo”, Boletín de la Real Academia Española (BRAE), 99 (319), pp. 5-44.

Blasco, Javier (2022), “La «boutade» de la muerte del autor: El caso de Carmen Mola”, Anales de literatura española contemporánea (ALEC), 47 (3), pp. 249-266.

Blasco, Javier y Cristina Ruiz Urbón (2009), “Evaluación y cuantificación de algunas técnicas de ‘Atribución de autoría’ en textos españoles”, Castilla. Estudios de literatura, 0, pp. 27-47.

Burrows, John Frederick (2002), “«Delta»: A measure of stylistic difference and a guide to likely authorship”, Literary and Linguistic Computing, 17 (3), pp. 267-287.

Calvo Tello, José (2016), “Entendiendo Delta desde las Humanidades”, Caracteres. Estudios culturales y críticos de la esfera digital, 5 (1), pp. 140-176.

Campión Larumbe, Miguel y Álvaro Cuéllar (2021), “Discernir entre original y refundición en el teatro del Siglo de Oro a través de la estilometría: el caso de El mejor amigo, el muerto”, Talía. Revista de estudios teatrales, 3, pp. 59-69.

Cerezo Soler, Juan y José Calvo Tello (2019), “Autoría y estilo. Una atribución cervantina desde las humanidades digitales. El caso de La conquista de Jerusalén”, Anales Cervantinos, 51, pp. 231-250.

Correas, Gonzalo (1924), Vocabulario de refranes y frases proverbiales y otras fórmulas comunes de la lengua castellana, Madrid, Tipografía de la Revista de Archivos, Bibliotecas y Museos.

Cotarelo y Mori, Emilio (1911), Colección de entremeses. Loas, bailes, jácaras y mojigangas desde fines del siglo XVI á mediados del XVIII, Madrid, Casa Bailly Bailliére, tomo I, vol. I.

Coulthard, Malcolm (2004), “Author identification, idiolect and linguistic uniqueness”, Applied Linguistics, 25 (4), pp. 431-447.

Coulthard, Malcolm (2005), “The Linguistic as Expert Witness”, Linguistics and the Human Sciences, 1 (1), pp. 39-58.

Eder, Maciej (2013), “Bootstrapping Delta: A safety net in open-set authorship attribution”, Digital Humanities 2013. Conference abstracts. University of Nebraska/Lincoln, USA. 16-19 July 2013, pp. 169-172.

Eder, Maciej (2015), “Does size matter? Authorship attribution, small samples, big problem”, Digital Scholarship in the Humanities, 30 (2), pp. 167-182.

Eder, Maciej (2017), “Short samples in authorship attribution: A new approach”, Digital Humanities 2017: Conference abstracts. Montreal, Canada, pp. 221-224. Disponible en: https://dh2017.adho.org/abstracts/341/341.pdf (fecha de consulta: 28/11/2022).

Eder, Maciej, Mike Kestemont y Jan Rybicki (2016), “Stylometry with R: A Package for Computational Text Analysis”, The R Journal, 8 (1), pp. 107-121.

Fradejas Rueda, José Manuel (2016), “El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas”, Caracteres: estudios culturales y críticos de la esfera digital, 5 (2), pp. 196-245.

Fradejas Rueda, José Manuel (2019), “Estilometría y Edad Media castellana”, Romanische Studien, 6, pp. 49-74.

García-Reidy, Alejandro (2019), “Deconstructing the Authorship of Siempre ayuda la verdad: A Play by Lope de Vega?”, Neophilologus, 103, pp. 493-510.

Graeme, Hirst y Ol’ga Feiguina (2007), “Authorship attribution for small texts: Literary and forensic experiments”, International Workshop on Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection, 30th Annual Internacional ACM SIGIR Conference (SIGIR ’07), Amsterdam, Netherlands. Disponible en: http://ceur-ws.org/Vol-276/paper3.pdf (fecha de consulta: 28.11.2022).

Grieve, Jack (2007), “Quantitative Authorship Attribution: An Evaluation of Techniques”, Literary and Linguistic Computing, 22 (3), pp. 251-270.

Hernández Lorenzo, Laura (2019a), Los textos poéticos de Fernando de Herrera: Aproximaciones desde la Estilística de corpus y la Estilometría, tesis doctoral, Universidad de Sevilla. Disponible en: https://idus.us.es/handle/11441/93465 (fecha de consulta: 28.11.2022).

Hernández-Lorenzo, Laura (2019b), “Poesía áurea, estilometría y fiabilidad: métodos supervisados de atribución de autoría atendiendo al tamaño de las muestras”, Caracteres. Estudios culturales y críticos de la esfera digital, 8 (1), pp. 189-228.

Hoover, David L. (2004), “Testing Burrows’s Delta”, Literary and Linguistic Computing, 19 (4), pp. 453-475.

Houvardas, John y Efstathios Stamatatos (2006), “N-gram feature selection for authorship identification”, en. J. Euzenat y J. Domingue (eds.), Proceedings of Artificial Intelligence: Methodologies, Systems, and Applications, Springer Verlag, pp. 77-86.

Huerta Calvo, Javier (coord.) (2008), Historia del teatro breve en España, Madrid/Frankfurt am Main, Iberoamericana/Vervuert.

Koppel, Moshe, Jonatan Schler y Elisheva Bonchek-Dokow (2007), “Measuring differentiability: Unmasking pseudonymous authors”, Journal of Machine Learning Research, 8, pp. 1261-1276.

Luyckx, Kim (2010), Scalability Issues in Authorship Attribution, Brussels, University Press Antwerp.

Marquina, Montse y Sheila Queralt (2014), “Similarity threshold to detect plagiarism in Spanish”, RAEL: revista electrónica de lingüística aplicada, 13 (1), pp. 79-95.

Menéndez Pelayo, Marcelino (ed.) (1903), Flor de entremeses y sainetes de diferentes autores (1657), Madrid, Imprenta de Fortanet, segunda edición corregida.

Rißler-Pipka, Nanete (2016), “Avellaneda y los problemas de la identificación del autor. Propuestas para una investigación con nuevas herramientas digitales»”, en El otro Quijote. La continuación de Avellaneda y sus efectos, Hanno Ehrlicher (ed.), mesa redonda. Augsburgo: Universität Augsburg, pp. 27-51.

Rojas Castro, Antonio (2017), “Luis de Góngora y la fábula mitológica del Siglo de Oro: Clasificación de textos y análisis léxico con métodos informáticos”, Studia Aurea, 11, pp. 111-142.

Rosa, Javier de la y Juan Luis Suárez (2016), “The Life of Lazarillo de Tormes and of his Machine Learning Adversities. Non-Traditional Authorship Attribution Techniques in the Context of the Lazarillo”, Lemir. 20, pp. 373-438.

Rybicki, Jan y Maciej Eder (2011), “Deeper Delta across genres and languages: Do we really need the most frequent words?”, Literary and Linguistic Computing, 26 (3), pp. 315-321.

Sanderson, Conrad y Simon Guenter (2006), “Short text authorship attribution via sequence kernels, Markov chains and author unmasking: An investigation”, Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing (EMNLP 2006), Sydney, Australia, pp. 482-491.

Smith, Peter W. H. y W. Aldridge (2011), “Improving authorship attribution: Optimizing Burrows’ delta method”, Journal of Quantitative Linguistics, 18 (1), pp. 63-88.

Statamatos, Efstathios (2009), “A Survey of Modern Authorship Attribution Methods”, Journal of the American Society for Information Science and Technology, 60 (3), pp. 538-556.

Urzáiz Tortajada, Héctor (1997), “Un entremés olvidado de Luis Vélez de Guevara: Los atarantados”, Criticón, 71, pp. 127-157.

Vega García-Luengos, Germán (2021), “Las comedias de Lope de Vega: confirmaciones de autoría y nuevas atribuciones desde la estilometría”, Talía. Revista de estudios teatrales, 3, pp. 91-108.

Wrisley, David Joseph (2016), “Modeling the Transmission of al-Mubashshir Ibn Fātik’s Mukhtār al-Ḥikam in Medieval Europe: Some Initial Data-Driven Explorations”, Journal of Religion, Media and Digital Culture, 5 (1), pp. 228-257.

Descargas

Publicado

23/01/2023

Cómo citar

Ruiz Urbón, C. (2023). Sobre la validez de los análisis cuantitativos en los estudios de autoría de textos breves: el caso particular de los entremeses del Siglo de Oro. Ogigia. Revista Electrónica De Estudios Hispánicos, (33), 69–96. https://doi.org/10.24197/ogigia.33.2023.69-96

Número

Sección

Artículos