Tag: microformats

A Web e o HTML: Passado, presente e futuro (Parte 2)

25 de dezembro de 2007 às 12:20 | Lucas Petes | , , , , , , , , , ,

1993

  • a tag img é sugerida pelo time de desenvolvimento do Mosaic;
  • o Mosaic é lançado para o ambiente gráfico X e depois para Windows e Macintosh;

1994

  • Maio – Primeira World Wide Web Conference, organizada pelo CERN. Foi chamada de “a Woodstock da Web”, com 400 usuários e desenvolvedores;
    A Spyglass Inc. compra os direitos comerciais do Mosaic;
  • Julho – Sai a especificação do HTML 2;
  • Novembro – Nasce o Netscape, browser de uso extremamente simples – vale lembrar que praticamente todos os browsers de hoje seguem a estrutura visual do Netscape. Por conta da ‘necessidade’, criaram diversas tags arbitrariamente. Dificilmente apareciam nas grandes conferências da WWW e pareciam dirigir o padrão HTML. O Mozilla (contração de Mosaic Killer), um lagarto verde, era o mascote da empresa e era encontrado nas páginas do website. Aqui, o e-mail de lançamento do Netscape;
  • Final do Ano – É formada a W3C – World Wide Web Consortium, chefiada por Tim Berners-Lee;
  • Em algum ponto de 1994 – Início do projeto Opera, como pesquisa na Telenor, maior empresa norueguesa de telecomunicações;

1995

  • Início do ano – Novas tags surgem, rascunho do HTML 3 é liberado e a linguagem ganha especificação para tabelas;
  • Agosto – O Internet Explorer é anunciado, baseado em um licenciamento do Spyglass Mosaic. ActiveX seria o diferencial;
  • Setembro – Netscape propõe os frames;
  • Novembro – Internet Explorer é lançado para Win NT e 95;
    CSS é proposto e Microsoft promete implementação no IE;
    Rascunho da internacionalização do HTML, com suporte a diferentes alfabetos e sets de caracteres;
  • Em algum ponto de 1995 – Projeto Opera se torna uma empresa separada, a Opera Software ASA;

1996

  • Abril - W3C inicia rascunhos de padronização de scripting;
  • Julho – IE 3.1 é lançado para Mac e Windows 3.1;
  • Dezembro – Início dos trabalhos no projeto codinome Cougar, que viria a ser o HTML4;

1997

  • Janeiro – Especificação do HTML 3.2 (wilbur) é liberada, como um grande acordo entre os players do mercado. A especificação já inclui applets, tables, float de textos em torno de imagens, sobrescritos e subescritos;

1998

  • Fevereiro – Netscape libera o código do Netscape Communicator 5, em fase de projeto. Cria o mozilla.org, pra organizar o desenvolvimento;
  • 2° trimestre – HTML 4 (Cougar) é liberado como recomendação da W3C;
  • Outubro – Código do Netscape 5 é considerado sem futuro e é descartado. O “Mozilla” começa a ser reescrito do zero, tendo como meta o suporte aos padrões HTML4, XML, DOM e CSS1;
  • NovembroAOL compra Netscape. Daí em diante, todos os releases do Netscape seriam baseados no Mozilla;
  • Dezembro – W3C libera rascunho de ‘reformulação do HTML em XML’ – codinome Voyager – que viria a ser o XHTML;
  • Em algum ponto de 1998 – Fundado o WaSP: Web Standards Project. Aqui, a missão inicial do projeto.

2000

  • Janeiro – XHTML 1.0 passa a ser Recomendação da W3C;
  • Março – estouro da bolha da internet;
  • Em algum ponto de 2000 – Lançado o Opera Mobile;

2001

  • Maio – XHTML 1.1 passa a ser Recomendação da W3C;
  • Agosto – Lançado o Microsoft Internet Explorer 6;

2002

  • Setembro – Release do Phoenix 0.1, versão independente do Mozilla Navigator (futuro Firefox);

2003

2004

  • Fevereiro – Mozilla Firebird é rebatizado como Mozilla Firefox;
  • Novembro – Lançado o Mozilla Firefox 1.0;
  • Em algum ponto de 2004 – Após um workshop da W3C, Apple, Mozilla e Opera, insatisfeitos com os rumos que a W3C estava dando ao XHTML/HTML (se distanciando das reais necessidades dos autores), fundaram o WHATWG. O HTML 5 (Web Applications 1.0) é o principal foco do WHATWG e também do novo W3C HTML Working Group;

2005

  • Outubro - Firefox bate a marca de 100 milhões de downloads;
  • Em algum ponto de 2005 – A Mozilla Corporation é criada (mozilla.com);
    Criação dos Microformatos, projeto que visa adicionar mais semântica ao código HTML (machine understandable).

2006

  • Outubro – Lançado o Microsoft Internet Explorer 7;
  • Em algum ponto de 2006 – Lançado o Opera Mini, em Java, para celulares;
    Opera lançado para Nintendo DS e Wii.

2007

  • Junho – Opera Mini 4 é lançado;
    Versão beta do Safari para Windows é lançada;
  • Dezembro – Internet Explorer 8, ainda em desenvolvimento, passa no teste Acid2, do WaSP. Até então, somente o Opera 9.2 havia passado.

2008

  • Início do ano (esperado) – Lançamento do Mozilla Firefox 3, Opera 9.5 e beta do IE8;

No próximo post, o uso do HTML ao longo dos anos pelos desenvolvedores.

Fonte:

http://www.w3.org/People/Raggett/book4/ch02.html
http://br.mozdev.org/sobre/crono/
http://www.eskimo.com/~bloo/indexdot/history/html.htm

Uma web mais inteligível por homens e máquinas

3 de outubro de 2007 às 11:28 | Lucas Petes | , , , , , , , ,

É fato o crescimento e a popularização crescente da internet ano a ano. A quantidade de conteúdo produzido na rede cresce de maneira exponencial. Os serviços hoje disponíveis de maior sucesso são os que oferecem a produção de conteúdo por qualquer pessoa que tenha vontade de fazê-lo – desde escrever um artigo na Wikipedia a publicar o que está fazendo em 140 caracteres no Twitter.

Ok. Temos uma enorme quantidade de conteúdo disponível por ai. Como organizá-lo?

Como fazer com que a dona de casa que procura a receita do quindim da vovó encontre essa informação entre zilhões de terabytes de dados?

Os mecanismos de busca atuais, tais como Google, Yahoo e Live fazem uso das palavras-chave inseridas, encontram entre as páginas indexadas – ou não – os termos e retornam os resultados por ordem de relevância, popularidade da página (pagerank) e outros ‘n’ critérios.

O que é feito hoje por tais sistemas é um trabalho extremamente difícil – claro, não vemos um ‘novo Google’ por ai todos os dias. A maioria dos sites online hoje ainda não seguem os padrões web, o que dificulta a indexação do que é realmente relevante. Quindim da Vovó escrito dentro de uma tag <h1> indica um título e é muito mais relevante para o buscador do que se escrito dentro de um <span>, independente de que no CSS o <span> esteja estilizado pra uma fonte tamanho 26. A linguagem de marcação (seja ela o HTML ou XHTML) já carrega consigo inúmeras possibilidades semânticas, tais como títulos, listas (ordenadas, não-ordenadas, de definição), endereços, acrônimos, abreviações, dados retirados ou inseridos, ênfases, etc.

Em geral, a semântica (do grego semantikos, derivado de sema, sinal) refere-se ao estudo do significado, em todos os sentidos do termo. A semântica opõe-se com freqüência à sintaxe, caso em que a primeira se ocupa do que algo significa, enquanto a segunda se debruça sobre as estruturas ou padrões formais do modo como esse algo é expresso (por exemplo, escritos ou falados).

Wikipedia

Microformats

Iniciativa de dois caras influentes da internet, Tantek Çelik e Eric Meyer, os microformats são uma biblioteca de formatos abertos para descrever ao máximo o conteúdo de um documento (X)HTML, através de padrões para o conteúdo dos atributos class, rel e rev. Dessa maneira, um parser consegue identificar do que se trata um bloco de código e trabalhá-lo, tal como gerar um vCard, arquivar reviews de produtos, montar uma rede de relacionamentos por XFN, etc. Além disso, um buscador ao visitar a página pode associar tal conteúdo semântico e torná-lo mais relevante em uma determinada busca. Em uma associação dos microformats e da semântica do XHTML, uma busca por “endereço milk-it” pode retornar um resultado mais preciso, já que tal informação se encontra em uma tag <address> e dentro da especificação vCard dos microformatos.

Iniciativas externas louváveis, como a criação dos bioformats – microformatos aplicados a biologia, dão mais força e motivos para a adoção de tal padrão. [1]

Contextos e homônimos

Como diferenciar em uma busca por “manga” os significados “fruta”, “parte da roupa” e “quadrinhos japoneses”?

O Google bem que tenta, mas é de fato uma tarefa extremamente complexa.

A descrição do conteúdo de uma página – seja através do código com microformatos, por tags ou outras formas de classificação – ajudaria bastante na desambiguação e aumentaria consideravelmente a qualidade dos resultados de uma busca.

Powerset

Em outros casos, diversas palavras semelhantes cabem para descrever o que se procura. Uma busca por “João brigou Maria” talvez não tenha tanto sucesso quanto “João discutiu Maria” ou “João separou Maria” “João Maria separados” , etc. No entanto, todas as opções são uma tentativa de encontrar conteúdo sobre um mesmo fato.

O buscador Powerset, quando lançado, promete realizar as buscas com a “linguagem natural”, analisando o que é buscado com base em uma análise lingüística. Ao invés de palavras-chave, são usadas expressões corridas.

No album de screenshots do buscador a busca é feita com o uso de um termo, uma conexão e outro termo. Entre os exemplos dados estão “’something’ cause cancer”, “’something’ prevent cancer”, ou ainda “Paris Hilton ’something’ sex”. Os resultados então aparecem em lista, ordenados pelas ocorrências de relações iguais ou semelhantes às palavras buscadas.

RDF

Bom, pra completar o assunto da web semântica, falta falar sobre o RDF, RDFa e mais alguns detalhes. Mas pra isso, usarei outro post para poder explorar melhor o assunto e estudar mais até lá. :)

[1] via Revolução Etc.