Contenido Checked

Lenguaje de marcado

Temas relacionados: Programas de computadoras

Sabías ...

SOS Children ha intentado que el contenido de Wikipedia más accesible por esta selección escuelas. Infantil SOS es la mayor donación de caridad del mundo niños huérfanos y abandonados de la oportunidad de la vida familiar.

Ejemplo de RecipeBook, un lenguaje simple de marcas basado en XML para crear recetas. El marcado se puede convertir en HTML, PDF y Formato de texto enriquecido utilizando un lenguaje de programación o XSL.

Un lenguaje de marcas es un lengua artificial utilizando un conjunto de anotaciones al texto que describen cómo el texto debe ser estructurado, distribuido, o formateados. Lenguajes de marcas han estado en uso durante siglos, y en los últimos años también se han utilizado en los sistemas de composición tipográfica ordenador y de procesamiento de textos.

Un ejemplo bien conocido de un lenguaje de marcado en uso hoy en día en la informática es HyperText Markup Language ( HTML), uno de los más utilizados en la World Wide Web . HTML sigue algunas de las convenciones de marcado utilizados en la industria editorial en la comunicación de la obra impresa entre autores, editores e impresores.

Historia

El plazo marcado se deriva de la práctica tradicional de publicación de "aumente" 'un manuscrito, que implica la adición simbólico las instrucciones de la impresora en los márgenes de un manuscrito de papel. Durante siglos, esta tarea se hizo principalmente por tipógrafos especializados conocidos como "hombres de marcado" que marcaron a texto para indicar lo que tipo de letra, el estilo y el tamaño se debe aplicar a cada parte, y luego pasó el manuscrito a otros para composición tipográfica con la mano. Marcado también se aplica comúnmente por los editores, correctores y diseñadores gráficos.

GenCode

La idea de los lenguajes de marcas aparentemente fue presentado por primera vez mediante la publicación ejecutivo William W. Tunnicliffe en una conferencia en 1967, aunque él prefiere llamarlo "codificación genérica." Tunnicliffe llevaría más adelante el desarrollo de un estándar llamado GenCode para la industria editorial. Diseñador libro Stanley Fish también publicó la especulación a lo largo de líneas similares en la década de 1960. Brian Reid, en su disertación de 1980 en Carnegie Mellon University, desarrolló la teoría y una implementación funcional de marcado descriptivo en el uso real. Sin embargo, IBM investigador Charles Goldfarb es más común hoy en día como el "padre" de los lenguajes de marcas, a causa de su trabajo en IBM GML, y luego como presidente de la Organización Internacional para la Normalización comité que desarrolló SGML, el primer sistema de marcado descriptivo ampliamente utilizado. Goldfarb se le ocurrió la idea básica mientras se trabaja en un proyecto de principios para ayudar a un periódico informatizar su flujo de trabajo, aunque el registro publicado no aclara cuándo. Más tarde se familiarizó con la obra de Tunnicliffe y Pesca, y oyó una charla temprano por Reid que despertó aún más su interés.

Los detalles de la historia temprana de los lenguajes de marcas descriptivas son objeto de acalorados debates. Sin embargo, es claro que la idea era independiente descubrió varias veces a lo largo de los años 70 (y posiblemente a finales de los años 60), y se convirtió en una práctica importante a finales de los años 80.

Algunos ejemplos tempranos de lenguajes de marcas disponibles fuera de la industria editorial se pueden encontrar en las herramientas de composición tipográfica en Unix sistemas como troff y nroff. En estos sistemas, los comandos de formato se insertaron en el texto del documento de modo que el software de composición tipográfica podría formatear el texto de acuerdo con las especificaciones del editor. Ha sido un ensayo y error proceso iterativo para obtener un documento impreso correctamente. Disponibilidad de WYSIWYG ("lo que ves es lo que obtienes") software de publicación suplantado mucho uso de idiomas entre los usuarios casuales, aunque el trabajo editorial grave aún utiliza marcas para especificar la estructura no visual de los textos.

TeX

Otra norma importante es la publicación TeX , creado y perfeccionado continuamente por Donald Knuth en los años 1970 y 80. TeX se concentró en el diseño detallado del texto y la fuente descripciones con el fin de componer libros de matemáticas en la calidad profesional. Esto requiere Knuth para pasar un tiempo considerable a investigar el arte de archivos de texto. Sin embargo, TeX tiene una curva de aprendizaje, por lo que se utiliza principalmente en la academia, donde es el estándar de facto en muchas disciplinas científicas. Un paquete de macros TeX conocido como LaTeX proporciona un sistema de marcado descriptivo en la parte superior de TeX, y es ampliamente utilizado.

Scribe, GML y SGML

La primera lengua para hacer una distinción clara y limpia entre la estructura y la presentación era sin duda Scribe, desarrollado por Brian Reid y se describe en su tesis doctoral en 1980. Escribano fue revolucionario en un número de maneras, no menos importante que introdujo la idea de estilos separados del documento marcado, y de un gramática controlar el uso de los elementos descriptivos. Escriba influyó en el desarrollo de Generalized Markup Language (SGML más tarde) y es un antepasado directo a HTML y LaTeX.

A principios de 1980, la idea de que el marcado debe centrarse en los aspectos estructurales de un documento y salir de la presentación visual de esa estructura al intérprete llevó a la creación de SGML. El lenguaje fue desarrollado por un comité presidido por Goldfarb. Incorporó las ideas de muchas fuentes diferentes, incluyendo el proyecto de Tunnicliffe, GenCode. Sharon Adler, Anders Berglund, y James A. Marke eran también miembros clave del comité de SGML.

SGML especifica una sintaxis para incluir el margen de beneficio en los documentos, así como uno para describir por separado lo que las etiquetas se les permitió, y dónde (el Document Type Definition ( DTD) o esquema). Esto permitió a los autores crear y utilizar cualquier tipo de código que deseaban, la selección de las etiquetas que hicieron más sentido para ellos y fueron nombrados en sus propias lenguas naturales. Por lo tanto, SGML es propiamente una meta-lenguaje, y muchos lenguajes de marcas particulares se derivan de ella. Desde finales de los 80 en la mayoría de los nuevos lenguajes de marcado sustanciales se han basado en sistema SGML, incluyendo, por ejemplo TEI y DocBook. SGML se promulgó como norma internacional por Organización Internacional de Normalización, ISO 8879, en 1986.

SGML encontró amplia aceptación y uso en campos con mismos requisitos de documentación de gran escala. Sin embargo, se encontró en general a ser engorroso y difícil de aprender, un efecto secundario de intentar hacer demasiado y demasiado flexible. Por ejemplo, SGML hizo final etiquetas (o la creación de etiquetas, o incluso ambos) opcional en ciertos contextos, porque se pensaba que el marcado se realiza de forma manual por el personal de apoyo con exceso de trabajo que apreciarían las pulsaciones de teclado de ahorro.

HTML

Para 1991, se apareció a muchos que SGML estaría limitado a las aplicaciones comerciales y basadas en datos mientras Herramientas WYSIWYG (que almacenan documentos en formatos binarios propietarios) sería suficiente para otro aplicaciones de procesamiento de documentos.

La situación cambió cuando Sir Tim Berners-Lee , el aprendizaje de SGML del compañero de trabajo Anders Berglund y otros en CERN, que se utiliza sintaxis SGML para crear HTML. HTML se parece a otras lenguas de etiquetas basadas en SGML, a pesar de que comenzó como simple que la mayoría y una DTD formal no se desarrolló hasta más tarde. DeRose argumenta que el uso de HTML de marcado descriptivo (y SGML en particular) era un factor importante en el éxito de la Web, debido a la flexibilidad y extensibilidad que activar (otros factores incluyen la noción de direcciones URL y la distribución gratuita de los navegadores). Es bastante probable HTML el lenguaje de marcado más utilizado en el mundo de hoy.

Sin embargo, el estado de HTML como un lenguaje de marcas es discutida por algunos científicos de la computación. El argumento para esto es que HTML restringe la colocación de las etiquetas, que tengan que ser totalmente anidado dentro de otras etiquetas, o la etiqueta raíz del documento. Debido a esto, estos científicos sugieren que en lugar de HTML es un lenguaje de contenedor, después de una Modelo jerárquico.

XML

XML (Extensible Markup Language) es un lenguaje de marcas meta que ahora está ampliamente utilizados. XML fue desarrollado por el Consorcio de la World Wide Web, en un comité creado y presidido por Jon Bosak. El objetivo principal de XML era simplificar SGML, centrándose en un problema particular - los documentos en Internet. XML sigue siendo un metalenguaje como SGML, lo que permite a los usuarios crear cualquier etiqueta necesarios (de ahí "extensible") y luego describir esas etiquetas y sus usos permitidos.

Adopción XML fue ayudado porque cada documento XML puede ser escrita de tal manera que también es un documento SGML, y los usuarios SGML existentes y software podría cambiar a XML con bastante facilidad. Sin embargo, XML elimina muchas de las características más complejas y humanos orientada de SGML para simplificar la aplicación (mientras que el aumento de tamaño de marcado y la reducción de la legibilidad y la capacidad de edición). Otras mejoras rectifican algunos problemas SGML en el ámbito internacional, y han permitido analizar e interpretar jerarquía del documento, incluso si no DTD está disponible.

XML fue diseñado principalmente para entornos semi-estructurados como documentos y publicaciones. Sin embargo, pareció golpear una punto dulce entre la simplicidad y la flexibilidad, y fue rápidamente adoptado por muchos otros usos. XML es ahora ampliamente utilizado para la comunicación datos entre aplicaciones. Al igual que HTML, que puede ser descrito como un lenguaje "contenedor".

XHTML

Desde Enero 2000 todos Recomendaciones del W3C para HTML se han basado en XML en lugar de SGML, utilizando la abreviatura XHTML (E x tensible H yper T ext M arkup L anguage). La especificación del lenguaje requiere que los documentos Web XHTML deben ser documentos XML bien formados - esto permite que los documentos más rigurosos y sólidos durante el uso de etiquetas familiares de HTML.

Una de las diferencias más notables entre HTML y XHTML es la regla de que todas las etiquetas deben estar cerradas: Las etiquetas HTML vacías como
o bien debe ser cerrado con una etiqueta final regular, o sustituidos por una forma especial: (El espacio antes de la ' / 'en la etiqueta de cierre es opcional, sino que se utiliza con frecuencia, ya que permite que algunos navegadores web pre-XML y SGML analizadores, a aceptar la etiqueta). Otra es que todo valores de los atributos en las etiquetas deben ser citados. Por último, todos los nombres de etiquetas y atributos deben estar en minúsculas con el fin de ser válida; HTML, por otra parte, era entre mayúsculas y minúsculas.

Otras aplicaciones basadas en XML

Ahora existen muchas aplicaciones basadas en XML, incluyendo Resource Description Framework (RDF), XForms, DocBook, SOAP y la Lenguaje de Ontologías Web (OWL). Para obtener una lista parcial de éstos ven Lista de los lenguajes de marcado XML.

Características

Una característica común de muchos lenguajes de marcado es que se entremezclan el texto de un documento con instrucciones de marcado en el mismo flujo de datos o archivo. Esto no es necesario; es posible aislar el marcado de contenido de texto, utilizando punteros, compensaciones, identificaciones, u otros métodos para coordinar los dos. Tal "marcado enfrentamiento" es típico de las representaciones internas programas utilizan para trabajar con documentos marcados arriba. Sin embargo, incrustado o por marcadores "en línea" es mucho más común en otros lugares. Aquí, por ejemplo, es una pequeña sección de texto marcado en HTML:

Anatidae

La familia Anatidae incluye patos, gansos y cisnes, pero no los gritones estrechamente relacionadas.

Los códigos encerradas en paréntesis angulares son instrucciones de marcado (conocidos como etiquetas), mientras que el texto entre estas instrucciones es el texto real del documento. Los códigos de h1 , p , y em son ejemplos de marcado estructural, en que describen el uso previsto o significado del texto que incluyen. En concreto, h1 significa "este es un título de primer nivel", p significa "este es un párrafo", y em significa "esta es una palabra o frase enfatizado". Un programa que interpreta dichas marcado estructural pueden aplicar sus propias normas o estilos de presentación de las diferentes piezas de texto, utilizando tipografías diffent, audacia, tamaño de fuente, sangría, color, u otros estilos, como se desee. Una etiqueta como "h1" (nivel de cabecera 1) podría ser presentado en un gran audaz tipografía sans-serif, por ejemplo, o en un solo espacio (al estilo de máquina de escribir) documento que podría ser subrayado - o podría no cambiar la presentación en todos.

En contraste, el i etiqueta en HTML es un ejemplo de marcado de presentación; generalmente se utiliza para especificar una característica particular del texto (en este caso, el uso de un tipo de letra cursiva) sin especificar la razón de que la apariencia.

La Texto Encoding Initiative (TEI) ha publicado directrices extensas sobre cómo codificar los textos de interés en las ciencias humanas y sociales, desarrolladas a través de años de trabajo de cooperación internacional. Estas directrices son utilizados por los proyectos que codifican documentos históricos, las obras de eruditos particulares, puntos, o géneros, y así sucesivamente.

Uso alternativo

Si bien la idea de lenguaje de marcado de origen en los documentos de texto, hay un uso cada vez mayor de los lenguajes de marcas en áreas como gráficos vectoriales, servicios web, la sindicación de contenidos, y interfaces de usuario. La mayoría de estos son aplicaciones XML, ya que es un lenguaje bien definido y extensible. El uso de XML ha llevado también a la posibilidad de combinar múltiples lenguajes de marcado en un único perfil, como XHTML + SMIL y XHTML + MathML + SVG

Recuperado de " http://en.wikipedia.org/w/index.php?title=Markup_language&oldid=225599432 "