Conteúdo verificado

Linguagem de marcação

Assuntos Relacionados: Programação de Computadores

Você sabia ...

Crianças SOS tentou tornar o conteúdo mais acessível Wikipedia por esta selecção escolas. Crianças SOS é a maior doação de caridade do mundo órfãos e crianças abandonadas a chance da vida familiar.

Exemplo de RecipeBook, uma linguagem de marcação simples baseado em XML para a criação de receitas. A marcação pode ser convertida em HTML, PDF e Rich Text Format usando uma linguagem de programação ou XSL.

Uma linguagem de marcação é uma língua artificial usando um conjunto de anotações para texto que descrevem como o texto deverá ser estruturado, colocado para fora, ou formatado. Linguagens de marcação têm sido utilizados por séculos, e nos últimos anos também têm sido usados em sistemas de escrita computador e de processamento de texto.

Um exemplo bem conhecido de uma linguagem de marcação em uso hoje em computação é (HyperText Markup Language HTML), um dos mais utilizados na World Wide Web . HTML segue algumas das convenções de marcação utilizados na indústria editorial na comunicação de obra impressa entre autores, editores e impressoras.

História

A marcação termo é derivado da prática tradicional de publicação de "marcar" 'um manuscrito, que envolve a adição simbólica instruções da impressora nas margens de um manuscrito papel. Durante séculos, esta tarefa foi feito principalmente por tipógrafos especializados conhecidos como "homens de marcação" que marcaram acima o texto para indicar o que tipo de letra, o estilo eo tamanho devem ser aplicados a cada parte, e depois passou o manuscrito a outro para composição com a mão. Markup também era comumente aplicado pelos editores, revisores e designers gráficos.

GenCode

A ideia de linguagens de marcação aparentemente foi apresentado pela primeira vez ao publicar executivo William W. Tunnicliffe em uma conferência em 1967, embora prefira chamá-lo de "codificação genérica." Tunnicliffe viria a liderar o desenvolvimento de um padrão chamado GenCode para a indústria editorial. Designer de livro Stanley Fish, também publicado especulação ao longo de linhas semelhantes em final dos anos 1960. Brian Reid, em sua dissertação em 1980 Carnegie Mellon University, desenvolveu a teoria e um trabalho de implementação marcação descritivo em utilização real. No entanto, IBM pesquisador Charles Goldfarb é mais comumente visto hoje como o "pai" de linguagens de marcação, por causa de seu trabalho em IBM GML, e depois como presidente do International Organization for Standardization comitê que desenvolveu SGML, o primeiro sistema de marcação descritiva amplamente utilizado. Goldfarb teve a idéia básica, enquanto trabalhava em um projeto cedo para ajudar um jornal informatizar o seu fluxo de trabalho, embora o registro publicado não esclarece quando. Mais tarde, ele tornou-se familiar com o trabalho de Tunnicliffe e Pesca, e ouviu uma conversa mais cedo por Reid, que provocou ainda mais seu interesse.

Os detalhes do início da história de linguagens de marcação descritivos são muito debatido. No entanto, é claro que a noção foi independentemente descoberto várias vezes ao longo dos anos 70 (e possivelmente o final dos anos 60), e tornou-se uma prática importante no final dos anos 80.

Alguns exemplos precoces de linguagens de marcação disponíveis no exterior indústria editorial pode ser encontrado em ferramentas de composição em Unix sistemas como troff e nroff. Nestes sistemas, os comandos de formatação foram inseridos no texto do documento para que o software de composição poderia formatar o texto de acordo com as especificações do editor. Foi um tentativa e erro processo iterativo para obter um documento impresso corretamente. Disponibilidade de WYSIWYG ("o que você vê é o que você") software de editoração suplantado muito uso de línguas entre os usuários casuais, embora obra de publicações grave ainda usa marcação para especificar a estrutura não-visual de textos.

TeX

Outra grande padrão de publicação é TeX , criada e continuamente refinado por Donald Knuth na década de 1970 e 80. TeX concentrada na disposição detalhada de descrições de texto e da pia batismal, a fim de typeset livros de matemática em qualidade profissional. Isso exigiu Knuth para gastar um tempo considerável investigando a arte de diagramação. No entanto, TeX tem uma curva de aprendizagem, de modo que é usado principalmente em academia, onde ele é o padrão de fato em muitas disciplinas científicas. Um pacote de macro Tex conhecido como LaTeX oferece um sistema de marcação descritivo no topo do TeX, e é amplamente utilizada.

Scribe, GML e SGML

A primeira linguagem de fazer uma distinção clara e limpa entre a estrutura ea apresentação foi certamente Scribe, desenvolvido por Brian Reid e descreveu em sua tese de doutorado em 1980. Scribe foi revolucionário em uma série de maneiras, não menos que ele introduziu a idéia de estilos separadas do documento marcado para cima, e de um gramática controlar o uso de elementos descritivos. Scribe influenciou o desenvolvimento da Generalized Markup Language (SGML mais tarde) e é um ancestral direto para HTML e LaTeX.

No início de 1980, a ideia de que a marcação deve ser centrado sobre os aspectos estruturais de um documento e deixar a apresentação visual de que a estrutura para o intérprete levou à criação de SGML. A linguagem foi desenvolvida por um comitê presidido por Goldfarb. Ele incorporou idéias de muitas fontes diferentes, incluindo o projeto de Tunnicliffe, GenCode. Sharon Adler, Anders Berglund, e James A. Marke eram também os principais membros da comissão de SGML.

SGML especificada uma sintaxe para incluindo a marcação de documentos, bem como um para descrever separadamente que as etiquetas foram autorizados, e onde (a definição do tipo de documento ( DTD) ou esquema). Isto permitiu que os autores a criar e utilizar qualquer marcação que quisessem, selecionando as tags que fez mais sentido para eles e foram nomeados nas suas próprias línguas naturais. Assim, SGML é propriamente uma meta-linguagem, e muitas linguagens de marcação são derivados a partir dele. Desde o final dos anos 80 em diante, a maioria das novas linguagens de marcação substanciais têm sido baseados em sistema SGML, incluindo, por exemplo TEI e DocBook. SGML foi promulgada como uma norma internacional pela International Organization for Standardization, ISO 8879, em 1986.

SGML encontrou ampla aceitação e uso nos campos com muito exigências de documentação de grande escala. No entanto, verificou-se geralmente, verificou-se ser complicado e difícil de aprender, um efeito colateral de tentar fazer demasiado e ser muito flexível. Por exemplo, SGML fez final tags (ou start-tags, ou mesmo ambos) opcional em determinados contextos, porque pensava-se que a marcação seria feito manualmente pela equipe de apoio sobrecarregados que apreciam as teclas digitadas poupança.

HTML

Em 1991, ele apareceu para muitos que SGML seria limitada a aplicações comerciais e à base de dados enquanto Ferramentas WYSIWYG (que armazenados documentos em formatos binários proprietários) seria suficiente para a outra aplicações de processamento de documentos.

A situação mudou quando Sir Tim Berners-Lee , o aprendizado de SGML do colega de trabalho Anders Berglund e outros em CERN, usado sintaxe SGML para criar HTML. HTML se assemelha a outros idiomas tag baseados em SGML, embora ele começou como mais simples do que a maioria e um DTD formal não foi desenvolvido até mais tarde. DeRose argumenta que o uso de HTML de marcação descritiva (e SGML em particular) foi um fator importante para o sucesso da Web, por causa da flexibilidade e capacidade de expansão que permitiu (outros fatores incluem a noção de URLs ea distribuição gratuita de navegadores). HTML é bastante provável a linguagem de marcação mais utilizado no mundo de hoje.

No entanto, o status de HTML como uma linguagem de marcação é contestado por alguns cientistas da computação. O argumento para isso é que HTML restringe a colocação de etiquetas, obrigando-os a ser totalmente aninhada dentro de outras tags, ou a tag raiz do documento. Por causa disto, estes cientistas sugeriria que em vez de HTML é uma linguagem de recipiente, na sequência de um Modelo hierárquico.

XML

XML (Extensible Markup Language) é uma linguagem de marcação meta que agora é amplamente utilizado. XML foi desenvolvido pela World Wide Web Consortium, em um comitê criado e presidido pelo Jon Bosak. O principal objetivo do XML foi simplificar SGML concentrando-se em um problema particular - documentos na Internet. XML continua a ser uma meta-linguagem, como SGML, permitindo aos usuários criar todas as tags necessários (daí o "extensível") e, em seguida, descrevendo essas tags e seus usos permitidos.

Adoção XML foi ajudado porque cada documento XML pode ser escrito de tal forma que ele também é um documento SGML, e usuários e software SGML existentes poderia mudar para XML com bastante facilidade. No entanto, XML eliminado muitas das características mais complexas e orientadas para humanos de SGML para simplificar a implementação (enquanto o aumento do tamanho de marcação e reduzir a legibilidade e capacidade de edição). Outras melhorias rectificado alguns problemas SGML em ambientes internacionais, e tornou possível para analisar e interpretar hierarquia do documento, mesmo que não DTD está disponível.

XML foi projetado principalmente para ambientes semi-estruturados, como documentos e publicações. No entanto, ele apareceu para bater um sweet spot entre a simplicidade e flexibilidade, e foi rapidamente adotado por muitos outros usos. XML é agora amplamente utilizados para a comunicação dados entre aplicações. Como HTML, que pode ser descrito como uma linguagem "recipiente".

XHTML

Desde Janeiro de 2000 todo Recomendações do W3C para HTML ter sido baseada em XML, em vez de SGML, usando a abreviatura XHTML (E x H tensible Yper T ext M arkup L anguage). A especificação da linguagem exige que os documentos da Web XHTML devem ser documentos XML bem formados - isso permite que para documentos mais rigorosas e robustas enquanto usando tags HTML de familiares.

Uma das diferenças mais notáveis entre HTML e XHTML é a regra de que todas as tags devem ser fechadas: tags HTML vazias, tais como
ou deve ser fechada com uma marca de fim-regular, ou substituída por uma forma especial: (O espaço antes do ' / 'no final tag é opcional, mas frequentemente utilizado porque permite que alguns navegadores da Web pré-XML e interpretadores SGML, a aceitar a tag). Outra é que todos valores de atributos em tags devem ser citado. Finalmente, todos os nomes de tag e atributo devem estar em letras minúsculas, a fim de ser válida; HTML, por outro lado, era case-insensitive.

Outras aplicações baseadas em XML

Muitos aplicativos baseados em XML já existem, incluindo Resource Description Framework (RDF), XForms, DocBook, SOAP e do Web Ontology Language (OWL). Para obter uma lista parcial destas ver Lista de linguagens de marcação XML.

Características

Uma característica comum a muitas linguagens de marcação é que eles misturam o texto de um documento com instruções de marcação no mesmo fluxo de dados ou arquivo. Isto não é necessário; é possível isolar marcação do conteúdo do texto, usando ponteiros, offsets, IDs, ou outros métodos para coordenar os dois. Tal "marcação impasse" é típico para as representações internas programas usam para trabalhar com documentos marcados-up. No entanto, incorporado ou marcação "inline" é muito mais comum em outros lugares. Aqui, por exemplo, é uma pequena seção de texto marcado em HTML:

Anatidae

A família Anatidae inclui patos, gansos e cisnes, mas não os gritadores estreitamente relacionadas.

Os códigos fechados no ângulo entre parênteses são instruções de marcação (conhecidas como tags), ao passo que o texto entre essas instruções é o texto real do documento. Os códigos de h1 , p , e em são exemplos de marcação estrutural, na medida em que descrevem o objectivo pretendido ou significado do texto que incluem. Especificamente, h1 significa "este é um título de primeiro nível", p significa "isto é um parágrafo", e em significa "esta é uma palavra ou frase enfatizou". Um programa de interpretação de tal marcação estrutural pode aplicar as suas próprias regras ou estilos para apresentar as várias peças de texto, usando fontes diffent, ousadia, tamanho da fonte, indention, cor, ou outros estilos, como desejado. A tag como "h1" (nível de cabeçalho 1) pode ser apresentado em uma grande negrito sans-serif, por exemplo, ou de um documento com espaçamento uniforme (estilo máquina de escrever) que poderia ser sublinhado - ou ele pode não alterar a apresentação na tudo.

Em contraste, o i tag em HTML é um exemplo de marcação de apresentação; que é geralmente utilizado para especificar uma característica particular do texto (neste caso, o uso de um itálico) sem especificar a razão para que a aparência.

O Iniciativa de codificação de texto (TEI) publicou diretrizes abrangentes para como codificar textos de interesse nas ciências humanas e sociais, desenvolvidos através de anos de trabalho de cooperação internacional. Essas diretrizes são usados por projetos que codificam documentos históricos, as obras de estudiosos particulares, períodos ou gêneros, e assim por diante.

Uso alternativo

Embora a idéia de linguagem de marcação originou com documentos de texto, há um uso cada vez maior de linguagens de marcação em áreas como gráficos de vetor, web services, distribuição de conteúdo, e interfaces de usuário. A maior parte destes são aplicações XML porque é uma linguagem bem definida e extensível. O uso de XML também levou à possibilidade de combinar várias linguagens de marcação em um único perfil, como XHTML + SMIL e XHTML + MathML + SVG

Retirado de " http://en.wikipedia.org/w/index.php?title=Markup_language&oldid=225599432 "