ID persistente del dataset
|
doi:10.21950/YDVJ51 |
Fecha de publicación
|
2024-02-06 |
Título
| Corpus de 100 textos correspondientes a 5 géneros textuales del ámbito de la Administración |
Autor
| Sara Pistola Grille (Universidad Nacional de Educación a Distancia (UNED)) - ORCID: 0000-0002-6011-8639
Iria Da Cunha Fanego (Universidad Nacional de Educación a Distancia (UNED)) - ORCID: 0000-0002-7707-1574
Susana Viñuales Ferreiro (Universidad Nacional de Educación a Distancia (UNED)) - ORCID: 0000-0002-3980-3236 |
Contacto
|
Utilice el botón de e-mail de arriba para contactar.
Sara Pistola Grille (Universidad Nacional de Educación a Distancia (UNED)) |
Descripción
| Descripción del proyecto
El contenido de este dataset es resultado de la investigación llevada a cabo en el proyecto "Tecnologías de la Información y la Comunicación para la e-Administración: hacia la mejora de la comunicación entre Administración y ciudadanía a través del lenguaje claro" (TIC-eADMIN), cuyo principal objetivo era desarrollar, en el contexto de la e-Administración, una herramienta TIC en línea de ayuda a la redacción de textos administrativos en español por parte de empleados públicos, para contribuir a que los textos que reciba la ciudadanía estén redactados en lenguaje claro. Esta herramienta ya se ha desarrollado y puede utilizarse gratuitamente en línea desde el siguiente enlace: www.sistema-artext.com. Asimismo, uno de los objetivos específicos del proyecto era sistematizar los rasgos lingüísticos prototípicos de algunos géneros textuales del ámbito de la Administración, para lo cual se anotó un corpus y se analizaron los resultados.
Descripción del dataset
Este dataset contiene 2 ficheros. El primero de ellos incluye un corpus de 100 textos reales (121.548 palabras) del ámbito de la Administración en formato .txt. Los textos se corresponden con 5 géneros textuales prototípicos de este ámbito: acta de inspección, contrato, requerimiento, resolución dirigida a un particular y resolución publicada en portales institucionales (20 textos por género). El segundo fichero contiene el mismo corpus de 100 textos anotado utilizando la herramienta ATLAS.ti, tanto en el formato propio de la herramienta (.atlproj23) como en XML. Para la anotación se tienen en cuenta los siguientes rasgos lingüísticos: apartados, títulos, contenidos y fraseología representativa para expresar esos contenidos. Los resultados de la anotación de este corpus y su posterior análisis se han integrado en el sistema arText para ayudar al personal público a estructurar y redactar estos géneros textuales dirigidos a la ciudadanía.
Metodología
La metodología empleada para la obtención de los datos incluye 5 etapas:
- Etapa 1. Selección de los 5 géneros textuales objeto del estudio. Los criterios de selección de los géneros son: frecuencia y dificultad de escritura de los géneros por parte del alumnado universitario de derecho y del personal público, y cantidad de texto libre presente en modelos o plantillas. Para obtener esta información se llevaron a cabo dos encuestas: una al alumnado de la UNED y otra al personal del Ayuntamiento de Madrid.
- Etapa 2. Compilación del corpus. El corpus está formado por 100 textos (20 por cada género textual) generados por el Ayuntamiento de Madrid, institución que se ha tomado como caso de estudio. Esta cantidad es estadísticamente representativa para el análisis de textos de ámbitos especializados, según se indica en investigaciones previas.
- Etapa 3. Transformación del corpus a texto plano y anonimización. Los textos del corpus se encuentran en distintos formatos, por lo que se transforman a texto plano. Asimismo, los textos de carácter privado (correspondientes a los géneros acta de inspección, requerimiento y resolución dirigida a un particular) se anonimizan.
- Etapa 4. Selección de los rasgos lingüísticos que se tienen en cuenta para el análisis del corpus. Los rasgos que se analizan son: a nivel textual, los apartados, los títulos y los contenidos, y a nivel léxico, la fraseología.
- Etapa 5. Anotación del corpus mediante la herramienta ATLAS.ti. La anotación se lleva a cabo manualmente. Los rasgos lingüísticos se anotan en ATLAS.ti mediante códigos de distintos colores: los apartados en rojo, los títulos en verde, los contenidos en azul y la fraseología en amarillo.
|
Materia
| Artes y humanidades |
Palabra clave
| administración pública
anotación de corpus
ATLAS.ti
compilación de corpus
corpus textual
discurso especializado
estructura textual
fraseología
géneros textuales |
Publicación relacionada
| Pistola, Sara (2022). «Análisis de la estructura y contenidos de un corpus de géneros textuales del ámbito de la Administración». En Da Cunha, I. (Ed.). Lenguaje claro y tecnología en la Administración. 77–116. Granada: Comares. doi: 10.55323/edc.2022.38 https://doi.org/10.55323/edc.2022.38
Pistola, Sara; Da Cunha, Iria (2022). «La resolución administrativa publicada en portales web institucionales: un análisis basado en corpus». Estudios de Lingüística. Universidad de Alicante (ELUA) 38. 17-45. doi: 10.14198/ELUA.22442 https://doi.org/10.14198/ELUA.22442
Pistola, Sara; Da Cunha, Iria (2023). «Escritura de géneros textuales administrativos en el contexto académico y profesional español». Íkala, Revista de Lenguaje y Cultura, 28(3), 1–30. doi: 10.17533/udea.ikala.348531 https://doi.org/10.17533/udea.ikala.348531 |
Idioma
| Español |
Información de la subvención
| Ministerio de Ciencia, Innovación y Universidades: PGC2018-099694-A-I00 |
Depositante
| Admin, Dataverse |
Fecha de depósito
| 2024-02-05 |
Período de tiempo cubierto
| Start: 2017 ; End: 2021 |
Software
| ATLAS.ti, Version: 8.4.5 |
Material relacionado
| Herramienta utilizada para la anotación del corpus: ATLAS.ti versión 8.4.5. Resultados del análisis del corpus volcados en arText (www.sistema-arText.com). |
Datasets relacionados
| Pistola, Sara; Da Cunha, Iria; Viñuales, Susana, 2023, "Fichas con información lingüística sobre 5 géneros textuales del ámbito de la Administración", https://doi.org/10.21950/ZHXH9G, e-cienciaDatos; Pistola, Sara; Da Cunha, Iria; Viñuales, Susana, 2023, "Adaptación a lenguaje claro de fraseología administrativa", https://doi.org/10.21950/ZF2KRC, e-cienciaDatos |