|
Persistent Identifier
|
doi:10.21950/HWQR0G |
|
Publication Date
|
2025-04-23 |
|
Title
| Dataset de política de privacidad y términos de uso de aplicaciones móviles en inglés y castellano |
|
Subtitle
| Dataset bilingüe en inglés y castellano, html y texto plano |
|
Alternative Title
| Dataset de licencia y términos de uso |
|
Author
| GARCIA ARIAS, ENRIQUEhttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0006-6274-3880
Pastor Vargas, Rafaelhttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0000-0002-4089-9538
Robles-Gómez, Antoniohttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0000-0002-5181-0199
Tobarra, Llanoshttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0000-0003-2779-4042
Vidal Balboa, Pedrohttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0009-3707-7582
Blanco Aza, Danielhttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0006-5695-7815
Adrián Valtuille Pacioshttps://ror.org/02msb5n36ORCIDhttps://orcid.org/0009-0002-7280-5249 |
|
Point of Contact
|
Use email button above to contact.
García, Enrique (Universidad Nacional de Educación a Distancia (UNED)) |
|
Description
| Este dataset se enmarca dentro del proyecto: "Análisis de aplicaciones móviles desde la perspectiva de la protección de datos: Ciberprotección y Ciber-riesgos de la información de la ciudadanía" Los objetivos son la creación de un corpus de lenguaje natural para la modelización de las características de los términos de uso de las aplicaciones (móvil y web) y generación de Dataset de dichas licencias. Para ello se han implementado los procesos que recopilan de forma estructurada la Política de Privacidad y los Términos de Servicio en inglés y en castellano de las aplicaciones móviles. El alcance se circuscribe a las 177 aplicaciones de redes sociales con mayor número de descargas de Google Play. Las Políticas de Privacidad y los Términos de Servicio se recopilan mediante procesos automatizados de rastreo (Crawlers). Estos procesos descargan los documentos originales y convierten los formatos HTML a texto plano realizando los necesarios tratamientos de limpieza y preproceso (Data Cleaning y Data Curation), para componer un Corpus actualizado. (2025-04-10) |
|
Subject
| Computer and Information Science |
|
Keyword
| Aplicaciones Móviles https://csrc.nist.gov/glossary/term/mobile_device_security
Riesgos de Privacidad https://csrc.nist.gov/glossary/term/privacy_risk
Reglamento General de Protección de Datos (RGPD) https://csrc.nist.gov/glossary/term/general_data_protection_regulation
Corpus de Lenguaje Natural |
|
Topic Classification
| Privacy, Right of (LCSH) https://id.loc.gov/authorities/subjects/sh85107187.html
Data protection (LCSH) https://id.loc.gov/authorities/subjects/sh85035818.html
Natural language processing (LCSH) https://id.loc.gov/authorities/subjects/sh88006606.html |
|
Related Publication
| Is Cited By: Arias, Enrique García, Antonio Robles Gómez, Rafael Pastor Vargas, Llanos Tobarra, Pedro Vidal Balboa, and Mariano Méndez Suárez. "Dataset de licencia y términos de uso de apps móviles y análisis de riesgos de privacidad." In Actas de las X Jornadas Nacionales de Investigación en Ciberseguridad, pp. 10-17. Universidad de Zaragoza, 2025. isbn 978-84-10169-61-6 https://dialnet.unirioja.es/servlet/libro?codigo=1004073 |
|
Notes
| Los autores desean agradecer el apoyo del Gobierno de España (a través del Instituto Nacional de Ciberseguridad de España, INCIBE), con el Proyecto de Investigación Estratégico "Análisis de aplicaciones móviles desde la perspectiva de la protección de datos: Ciber-protección y Ciber-riesgos de la información ciudadana'', en el contexto del Plan de Recuperación, Transformación y Resiliencia financiado por la Unión Europea (NextGenerationEU/PRTR). |
|
Language
| English; Spanish |
|
Production Date
| 2025-04-10 |
|
Production Location
| Ponferrada |
|
Funding Information
| Unión Europea (NextGenerationEU/PRTR) |
|
Depositor
| García, Enrique |
|
Deposit Date
| 2025-04-09 |
|
Time Period
| Start Date: 2024-04-01 ; End Date: 2025-04-01 |
|
Date of Collection
| Start Date: 2024-04-01 ; End Date: 2025-04-01 |
|
Data Type
| Estructura de directorios por apk conteniendo html y texto plano |
|
Software
| python, Version: 3.10 |
|
Data Source
| Las fuentes de datos son las aplicaciones de google play identificadas como más descargadas de la categoría social. De cada aplicación la fuente es la política de privacidad y los términos de servicio públicamente disponibles |