ID persistente
|
doi:10.21950/HWQR0G |
Fecha de publicación
|
2025-04-23 |
Título
| Dataset de política de privacidad y términos de uso de aplicaciones móviles en inglés y castellano |
Subtítulo
| Dataset bilingüe en inglés y castellano, html y texto plano |
Título alternativo
| Dataset de licencia y términos de uso |
Autor
| GARCIA ARIAS, ENRIQUEhttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0006-6274-3880
Pastor Vargas, Rafaelhttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0000-0002-4089-9538
Robles-Gómez, Antoniohttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0000-0002-5181-0199
Tobarra, Llanoshttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0000-0003-2779-4042
Vidal Balboa, Pedrohttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0009-3707-7582
Blanco Aza, Danielhttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0006-5695-7815
Adrián Valtuille Pacioshttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0002-7280-5249 |
Contacto
|
Utilice el botón de e-mail de arriba para contactar.
García, Enrique (Universidad Nacional de Educación a Distancia (UNED)) |
Descripción
| Este dataset se enmarca dentro del proyecto: "Análisis de aplicaciones móviles desde la perspectiva de la protección de datos: Ciberprotección y Ciber-riesgos de la información de la ciudadanía" Los objetivos son la creación de un corpus de lenguaje natural para la modelización de las características de los términos de uso de las aplicaciones (móvil y web) y generación de Dataset de dichas licencias. Para ello se han implementado los procesos que recopilan de forma estructurada la Política de Privacidad y los Términos de Servicio en inglés y en castellano de las aplicaciones móviles. El alcance se circuscribe a las 177 aplicaciones de redes sociales con mayor número de descargas de Google Play. Las Políticas de Privacidad y los Términos de Servicio se recopilan mediante procesos automatizados de rastreo (Crawlers). Estos procesos descargan los documentos originales y convierten los formatos HTML a texto plano realizando los necesarios tratamientos de limpieza y preproceso (Data Cleaning y Data Curation), para componer un Corpus actualizado. (2025-04-10) |
Materia
| Ciencias de la información y computación |
Palabra clave
| Aplicaciones Móviles https://csrc.nist.gov/glossary/term/mobile_device_security
Riesgos de Privacidad https://csrc.nist.gov/glossary/term/privacy_risk
Reglamento General de Protección de Datos (RGPD) https://csrc.nist.gov/glossary/term/general_data_protection_regulation
Corpus de Lenguaje Natural |
Clasificación de materias
| Privacy, Right of (LCSH) https://id.loc.gov/authorities/subjects/sh85107187.html
Data protection (LCSH) https://id.loc.gov/authorities/subjects/sh85035818.html
Natural language processing (LCSH) https://id.loc.gov/authorities/subjects/sh88006606.html |
Publicación relacionada
| IsCitedBy: Arias, Enrique García, Antonio Robles Gómez, Rafael Pastor Vargas, Llanos Tobarra, Pedro Vidal Balboa, and Mariano Méndez Suárez. "Dataset de licencia y términos de uso de apps móviles y análisis de riesgos de privacidad." In Actas de las X Jornadas Nacionales de Investigación en Ciberseguridad, pp. 10-17. Universidad de Zaragoza, 2025. isbn 978-84-10169-61-6 https://dialnet.unirioja.es/servlet/libro?codigo=1004073 |
Notas
| Los autores desean agradecer el apoyo del Gobierno de España (a través del Instituto Nacional de Ciberseguridad de España, INCIBE), con el Proyecto de Investigación Estratégico "Análisis de aplicaciones móviles desde la perspectiva de la protección de datos: Ciber-protección y Ciber-riesgos de la información ciudadana'', en el contexto del Plan de Recuperación, Transformación y Resiliencia financiado por la Unión Europea (NextGenerationEU/PRTR). |
Idioma
| Inglés; Español |
Fecha de producción
| 2025-04-10 |
Lugar de producción
| Ponferrada |
Información de la subvención
| Unión Europea (NextGenerationEU/PRTR) |
Depositante
| García, Enrique |
Fecha de depósito
| 2025-04-09 |
Período de tiempo cubierto
| Start Date: 2024-04-01 ; End Date: 2025-04-01 |
Fecha de recolección
| Start Date: 2024-04-01 ; End Date: 2025-04-01 |
Tipo de datos
| Estructura de directorios por apk conteniendo html y texto plano |
Software
| python, Version: 3.10 |
Fuentes de datos
| Las fuentes de datos son las aplicaciones de google play identificadas como más descargadas de la categoría social. De cada aplicación la fuente es la política de privacidad y los términos de servicio públicamente disponibles |