Normas sobre Tecnologías de la Información y Comunicación - NORTIC

Normas sobre Tecnologías de la Información y Comunicación - NORTIC

Estructuracion de la información reutilizable

En tanto que en el capítulo acerca de la estructuración de la información reutilizable, se indican los distintos formatos a utilizar para las hojas de cálculo, textos, diferentes tipos de imágenes, audio, video, intercambio de datos, compresión sin pérdidas de datos y almacenamiento de documentos digitales.

También se indica en el capítulo anteriormente citado, los metadatos con los que debe contar cada información y conjunto de datos, así como el tipo de licencia con la que se estará publicando la información reutilizable.

  • Formatos Abrir o Cerrar
    1. Los formatos a utilizarse deben ser de estándares abiertos, sin embargo puede complementarse la información con estándares privativos para reforzar la publicación.
    2. En los casos que existan particularidades en las que sea necesario utilizar estándares privativos, esto debe ser justificado con una nota explicativa que acompañe la información, además de indicar el software que permita el procesamiento del formato.

    3. Para el procesamiento de información reutilizable de hojas de cálculo, los formatos mínimos requeridos son los siguientes:

      • El formato de Valores Separados por Comas (CSV, por sus siglas en inglés).

      • El formato de Hoja de Cálculo de Documento Abierto (ODS, por sus siglas en inglés).

      • El formato de Hoja de Cálculo Office Open XML (XLSX, por sus siglas en inglés).

    4. Para el procesamiento de información reutilizable de texto, los formatos mínimos requeridos son los siguientes:

      • El formato de Texto Simple (TXT, por sus siglas en inglés).

      • El formato para Texto de Documento Abierto (ODT, por sus siglas en inglés).

      • El formato de Documento Office Open XML (DOCX, por sus siglas en inglés).

    5. Las imágenes geográficas deben ser procesadas digitalmente mediante un Sistema de Información Geográfica (SIG) de licencia abierta con acceso a imágenes de formato tipo raster y de tipo vectorial, además de soportar estándares interoperables como el GML, KML, WFS25, WMS26 y el CSW, conformes al Consorcio Geoespacial Abierto (OGC, por sus siglas en inglés).

      1. Los formatos de imágenes que deben utilizarse para la publicación de información geográficas reutilizables tienen que soportar pesos bastantes grandes para el manejo de imágenes satelitales y ortofotos.

    6. Para el procesamiento de información reutilizable de datos geográficos, los formatos raster mínimos requeridos son los siguientes:

      • El formato de Grupo Conjunto Expertos en Fotografía (JPG, por sus siglas en inglés).

      • El formato de Gráficos de Red Portátiles (PNG, por sus siglas en inglés).

      • El formato de Base de Datos de Imagen con Multi-Resolución Constante (MrSID, por sus siglas en inglés).

    7. Para el procesamiento de información reutilizable de datos geográficos, los formatos vectoriales mínimos requeridos son los siguientes:

      • El formato SVG (SVG, por sus siglas en inglés).

      • El Lenguaje de Marcado Keyhole (KML, por sus siglas en inglés).

      • El Lenguaje de Marcado Geográfico (GML, por sus siglas en inglés).

    8. Debe utilizarse el Sistema de Coordenadas Geográficas Mundial 84 (WGS84, por sus siglas en inglés) como sistema de referencia geodésico para expresar las coordenadas a publicar.

    9. Para el procesamiento de información reutilizable de imágenes, los formatos mínimos requeridos son los siguientes:

      • JPG.

      • PNG.

      • El formato WebP.

    10. Para el procesamiento de información reutilizable de audio, los formatos mínimos elegibles son los siguientes:

      • El formato Ogg Vorbis con la extensión .ogg para archivos de audio en general.
      • El Códec Libre de Compresión de Audio sin Pérdida (FLAC, por sus siglas en inglés) para archivos de audio sin pérdida de calidad.

      • El formato Opus para archivos de audio de voz o de reproducción en tiempo real.

    11. Para el procesamiento de información reutilizable de video, los formatos mínimos elegibles son los siguientes:

      • El formato Ogg Theora con la extensión .ogv para propósitos de video en general.

      • El Códec XviD para videos de alta calidad en archivos de tamaño reducido.

      • El formato WebM orientado a la presentación de video en HTML5.

    12. Para el intercambio de datos, los formatos o lenguajes de marcado mínimos requeridos son los siguientes:

      • El lenguaje de marcado XML.

      • El formato de Notación de objetos de JavaScript (JSON, por sus siglas en inglés).

    13. Cuando los datos a publicar estén contenidos en una base de datos, su tipo debe ser relacional, soportar el Lenguaje de Consulta Estructurados (SQL, por sus siglas en inglés), y su licencia de código abierto.

    14. Cuando los datos estén implementados en grafos debe utilizarse SPARQL Lenguaje de consulta para RDF (SPARQL, por sus siglas en inglés) como lenguaje para la consulta de grafos RDF.
    15. Para la catalogación de los documentos o la información reutilizable debe utilizarse el RDF, el cual debe serializarse bajo el formato o notación Turtle (.ttl), de modo que sirva para especificar metadatos.

    16. El formato de fuente web para compartir contenido en Internet que debe utilizarse es el de Sindicación Realmente Simple (RSS, por sus siglas en inglés).

    17. Para el almacenamiento de imágenes de disco óptico debe utilizarse el formato ISO.

    18. Para la compresión sin pérdidas de datos, los formatos mínimos requeridos son los siguientes:

      • El formato de ZIP.

      • El formato de bzip2 (.bz2).

      • El formato de GNU ZIP (gzip/.gz, por sus siglas en inglés).

    19. Para el almacenamiento de documentos digitales, los formatos mínimos requeridos son los siguientes:

      • El Formato de Documento Portátil (PDF, por sus siglas en inglés).

      • El formato DjVu.

      • El formato de Publicación Electrónica50 (ePub, por sus siglas en inglés).

    20. El protocolo web para consultar y actualizar información que debe  utilizarse es el Protocolo de Datos Abiertos (ODATA, por sus siglas en inglés).
  • Catálogo Abrir o Cerrar
    1. El catálogo de información reutilizable de www.datos.gob.do debe estar clasificado, según las categorías descritas en en el punto sobre categorización de la información reutilizable y por los organismos gubernamentales. Este será el catálogo central del Gobierno Dominicano.

    2. Además, el catálogo debe presentar los metadatos de las informaciones publicadas, un listado de los conjuntos de datos de cada organismo, así como enlaces a otros datos relacionados a cierta información reutilizable siempre que sea posible.

    3. Los catálogos elaborados como iniciativas particulares de un organismo gubernamental, deben alinearse y enlazarse al catálogo central del Gobierno.

    4. En cualquiera de los catálogos de los organismos gubernamentales, así como el en www.datos.gob.do, debe existir una herramienta de búsqueda. De modo que atendiendo a la NORTIC A2:2013:

      1. El motor de búsqueda debe manejar correctamente las consultas vacías, indicando al usuario que debe llenar el campo con el término que desee consultar.

      2. Los resultados de una búsqueda deben ser claros, útiles y clasificados por relevancia.

      3. No debe existir resultados duplicados al momento del usuario hacer una consulta.

      4. La página de resultados de una búsqueda debe indicar claramente cuántos resultados tuvo la búsqueda.

    5. El catálogo debe proveer guías y sugerencias para el usuario que lo ayuden a lograr sus objetivos y consultas.

    6. De cada organismo gubernamental se espera la publicación de ciertos tipos de informaciones principales, las cuales se muestran en la propuesta de categorías para los organismos gubernamentales, sin embargo, es posible la relación de información con otro tipo de categoría de las listadas en en punto sobre categorización de la información reutilizable de ser necesario.

      1. Tanto las sub-categorías y palabras claves presentadas en la propuesta de categorías para los organismos gubernamentales, pueden perfectamente relacionarse con cualquiera de las categorías definidas en esta norma, de modo, que un organismo gubernamental puede pertenecer a una categoría determinada,
        sin embargo, el conjunto de datos que desea publicar pertenecer a otra categoría. Lo mismo para las sub-categorías y palabras claves definidos.

      2. Las categorías y sub-categorías definidas en esta norma son las únicas que deben utilizarse para la identificación del organismo como para el conjunto de datos a publicar. En cambio, las palabras
        claves, además de poder ser más de una, también pueden agregarse a libertad, siempre y cuando este metadato ayude a procesar mejor la información publicada.

      3. Si el organismo entiende que para el conjunto de datos que desea publicar no existe una categoría o sub-categoría que logre relacionar su información de manera clara y comprensible, puede enviar sus propuestas de categorías o sub-categorías, al correo Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo., desde el cual se le estará respondiendo si dicha propuesta es aceptada para entonces admitirla como una excepción, o si la propuesta es denegada, para entonces pautar las reuniones que sean necesarias y asesorar al organismo para que logre categorizar su conjunto de datos de forma efectiva.

  • Taxonomía Abrir o Cerrar
    1. Para la mejor taxonomía de la información reutilizable, se ha definido sub-categorías relacionadas a las categorías definidas en el punto sobre categorización de la información reutilizable.
    2. Algunas sub-categorías pueden cruzarse entre diferentes categorías, según sea necesario, y solo son permitidas las listadas a continuación: acuicultura, agricultura, agua, asistencia social, cine, competitividad, comunicación,
      cultura, delito, deporte, educación superior, emergencia, energía, estadística, finanzas, formación, ganadería, industria y comercio, infraestructura, nvestigación, juventud, mujer, municipios, parque, participación ciudadana, petróleo, políticas públicas, protección y derechos, seguridad nacional, seguridad pública, TIC, trabajo, transparencia, transporte (aéreo, marítimo y terrestre) y turismo.

  • Metadatos Abrir o Cerrar
    1. Debe organizarse, clasificar y relacionarse la información reutilizable, en  función de metadatos.

    2. La estructura de los metadatos se definirá mediante el vocabulario para catálogo de datos DCAT.

    3. Cada conjunto de datos debe ofrecer los metadatos siguientes:

      1. Título, el cual define el nombre del conjunto de datos.

      2. Descripción, donde se explica de forma breve de que trata el contenido del conjunto de datos.

      3. Organismo, el cual contiene el nombre del organismo gubernamental.

      4. Licencia, donde se especifica el tipo de derecho de uso, copia, distribución o modificación de la información publicada.

      5. Categoría, indicando con cuál de las categorías determinadas en el punto sobre  categorización de la información reutilizable se relaciona el conjunto de datos.

      6. Sub-categoría, este es otro nivel de especificación del conjunto de datos para delimitar mucho más su naturaleza informativa. Para este caso, se utilizarán las sub-categorías determinadas en el punto sobre taxonomía. 

      7. Fecha de publicación, especificando la fecha de publicación del conjunto de datos y la hora, la cual debe estar basada en el sistema horario de 24 horas. Este metadato debe estar expresado de la forma siguiente: YYYY-MM-DD hh:mm:ss.

      8. Fecha de actualización, especificando la fecha de la última modificación del conjunto de datos y la hora, acatándose el punto sobre metadatos.

      9. Recurso, aludiendo a todos los contenidos o diferentes formatos comprendidos en el conjunto de datos.

        1. Del mismo modo, cada recurso debe ofrecer los metadatos siguientes:
          1. Título, conteniendo el nombre del recurso.

          2. Descripción, donde se explica de forma breve detalles particulares del recurso.

          3. Enlace, indicando su respectivo Localizador de Recursos Uniforme (URL).

          4. Formato, este metadato puede ser expresado, tan solo indicando la extensión del recurso.

          5. Fecha de publicación, también indicando la fecha de publicación del conjunto de datos y la hora, acatándose en el punto sobre  metadatos.

        2. Palabras claves, indicando los términos y separados por coma (,) que logren describir el conjunto de datos.

        3. Cobertura geográfica, especificando el municipio, la provincia, la región y el país.

  • Licencias Abrir o Cerrar
    1. El tipo de licenciamiento debe indicarse como metadato para cada conjunto de datos que se desee publicar, de manera que los derechos de reutilización queden claros para los potenciales usuarios.

    2. Para la publicación de información reutilizable, los tipos de licencias a utilizar serán los siguientes:

      • La Licencia Pública General de GNU (GNU/GPL, por sus siglas en inglés), la cual permite a personas o empresas, la libertad de compartir, usar, estudiar y modificar una obra.

      • La Licencia Creative Commons Atribución-CompartirIgual (CC BY-SA, por sus siglas en inglés), la cual permite copiar, distribuir, ejecutar, comunicar públicamente una obra y hacer derivados de la misma bajo una licencia idéntica a esta, ya sea para fines comerciales o no comerciales.

      • La Licencia de Base de Datos Abierta (ODBL, por sus siglas en inglés), la cual permite copiar, distribuir, ejecutar, comunicar públicamente una base de datos y hacer derivados de la misma bajo una licencia idéntica a esta, ya sea para fines comerciales o no comerciales.

    3. El portal web www.datos.gob.do y las iniciativas de organismos gubernamentales sobre medios web para la publicación de información reutilizable, deben presentar en la parte anterior al pie de página, todas las insignias de licencias que rigen el uso y permiso de la información publicada.