O Markdown está morto e o HTML é o novo rei?

Os humanos passaram meio século migrando documentos de máquinas de escrever para o Word e mais vinte anos para a nuvem. No entanto, o formato verdadeiramente universal para a era da IA é uma linguagem de texto simples inventada em 2004: o Markdown.
Recentemente, Thariq, engenheiro da Claude Code, apresentou um novo ponto de vista, afirmando que não utiliza mais Markdown e que o HTML é o futuro, o que gerou muita discussão.

▲ Um artigo do engenheiro de código Claude Thariq sobre a substituição de Markdown por HTML, que já recebeu dezenas de milhões de visualizações no X.
No artigo, ele propôs que a saída em HTML é um formato melhor do que o texto em Markdown. Para a IA, a conversão de Markdown para HTML é essencialmente indolor, mas para os usuários, representa uma melhoria tangível na experiência do usuário.
Karpathy também compartilhou este artigo hoje cedo, compartilhando suas ideias sobre HTML.
Em sua visão, o áudio é a melhor entrada para grandes modelos de linguagem, e a visão é a melhor saída. O caminho que ele vislumbra inclui animações interativas, vídeos gerados diretamente por redes neurais e, em última instância, uma verdadeira fusão da percepção humana e da máquina.

Com a popularização dos produtos Vibe Coding e Agent, HTML e Markdown provavelmente não são desconhecidos para a maioria dos profissionais de IA.

▲ Quando você pede ao DeepSeek para criar um pequeno jogo, ele fornecerá diretamente um arquivo de código HTML funcional.
Se você quiser criar um joguinho simples, pode dizer ao ChatGPT: "Crie uma página HTML de uma única página para o jogo da cobrinha". O ChatGPT irá empacotar o código em um documento com a extensão .html. Clique duas vezes para abri-lo e você verá um resultado interativo, animado e ricamente ilustrado no seu navegador.
Mesmo dentro de um navegador, em qualquer página da web, pressionar CTRL+S para salvar um arquivo local resulta em um documento .html.
Na época em que a IA precisava extrair o contexto de páginas da web, já existiam diversas ferramentas capazes de converter diretamente documentos de vários tipos de arquivo para o formato Markdown.
A Microsoft, líder entre os três pacotes de aplicativos de escritório, utiliza comumente formatos de arquivo como docx, pptx e xlsx. Ela também disponibilizou anteriormente um projeto de código aberto para converter esses documentos do Office para o formato Markdown, que agora conta com mais de 120.000 estrelas no GitHub.

▲ Endereço do projeto: https://github.com/microsoft/markitdown
Após o sucesso do OpenClaw, vários arquivos AGENT.md, SOUL.md, CLAUDE.md, MEMORY.md e até mesmo dentro do projeto Skills, cada Skill também possui um documento Skill.md.
Da preservação da memória aos prompts e ao controle do agente, o formato Markdown tornou-se praticamente a única opção para a IA obter um contexto rico.

▲ O OpenClaw AI utiliza vários arquivos Markdown diferentes para construir o espaço de trabalho final | Imagem gerada por IA
Os formatos PDF, DOC e PPT, que usamos com mais frequência em nosso trabalho diário, tornaram-se os formatos "menos preferidos" na era da IA.
Mas o que está acontecendo com o surgimento do HTML agora? Será que ele terá a oportunidade de substituir o Markdown como a nova linguagem universal da era da IA?
Por que o Markdown é a melhor opção para IA?
Vamos começar falando sobre por que o Markdown se tornou a linguagem da era da IA. Seja nas respostas da IA ou no contexto que fornecemos a ela, tudo é baseado em Markdown atualmente.
Essa linguagem foi criada em 2004, inspirada nas convenções de formatação de texto de e-mails da década de 2000 — linhas verticais, quebras de linha de 80 caracteres e asteriscos para ênfase. Seu objetivo era "escrever como texto simples e renderizar como HTML". É simples o suficiente, portátil o suficiente, não requer ferramentas e pode ser usada por qualquer editor de texto.

▲ Guia de sintaxe Markdown | Imagem gerada por IA
Essa filosofia de design era perfeita na era dos blogs. Por volta de 2008, com a ascensão do GitHub, o Markdown se tornou o formato de escrita padrão para programadores. O Markdown funciona bem em praticamente todos esses cenários: documentação técnica, respostas no Stack Overflow, arquivos README do GitHub e blogs técnicos.
Em seguida, veio o modelo de linguagem abrangente.
Por um lado, os dados de treinamento continham uma grande quantidade de texto formatado em Markdown, e o modelo aprendeu a usá-lo para expressar estrutura. Em outras palavras, os dados de treinamento consistiam em grande parte de Markdown, escrito por "pessoas inteligentes" em blogs e fóruns técnicos . O modelo aprendeu não apenas o formato, mas também a associação de que " escrever em Markdown = ser sério, estruturado e profissional ".
Por outro lado, os sinais estruturais do Markdown são altamente localizados; um título precisa apenas de um #, uma lista precisa apenas de um -, e ** indica negrito. O modelo não precisa analisar o contexto distante para determinar a função semântica do token atual.

▲ Para o mesmo artigo, HTML significa inúmeras tags, várias separações de blocos e controles de estilo, etc.
Comparado aos cabeçalhos e listas HTML (<h1>, </h1> ou <li>, </li>), isso é muito mais eficiente. Além disso, a `<div class="section">` do HTML não fecha até que `</div>` seja fechada, resultando em um intervalo semântico maior, exigindo que o modelo "lembre" de estados anteriores durante a geração. Isso impõe uma carga maior ao modelo e aumenta a probabilidade de erros.
Portanto, seja do ponto de vista técnico do mecanismo de atenção de grandes modelos de linguagem ou do ponto de vista da economia de tokens, "usar Markdown em vez de HTML, se possível" tornou-se a preferência tanto de engenheiros quanto de modelos em cenários com documentos longos, diálogos com várias interações e um grande número de chamadas de API.
Em resumo, o valor fundamental do Token — alta eficiência, estrutura clara e análise sintática simples — faz com que o modelo naturalmente adore o Markdown; ele adora tanto a entrada quanto a saída em Markdown.
Essa preferência torna-se ainda mais pronunciada ao treinar modelos de linguagem de grande porte.
Quando o modelo realiza aprendizado por reforço (RLHF) usando feedback humano, as respostas que recebem notas altas dos anotadores são, com maior probabilidade, aquelas com títulos claros, marcadores e uma estrutura clara. Em um ambiente de texto simples, essa estrutura visual é representada pelo Markdown.
Portanto, o sinal de recompensa aprendido pelo modelo é: usar a formatação Markdown = parece mais sério, mais completo e mais merecedor de uma pontuação alta. Mesmo que a pergunta não exija uma lista, o modelo tenderá a adicionar uma.

▲ Typora, um editor Markdown bastante conhecido
Provavelmente é por isso que, quando fazemos uma pergunta ao ChatGPT, ele tenta fornecer três pontos-chave, palavras-chave em negrito e um resumo. E, na maioria das vezes, quando você copia a resposta da IA da sua interface de diálogo e cola em outras caixas de entrada, você verá que ela adiciona automaticamente marcadores Markdown, como #, **, —, etc.
Todas as mensagens de texto que vemos nas respostas da IA são renderizadas no formato Markdown.
Por que não PDF, Word ou PPT?
O Markdown é útil, mas os formatos de documento que usamos no dia a dia são principalmente PDF e Word. Quando meu chefe me envia um arquivo e eu o envio para o AutoCAD para processamento, muitas vezes leva mais tempo do que se eu copiasse e colasse o texto manualmente.
A razão fundamental é que o modelo reconhece apenas tokens, não arquivos.
A entrada para um modelo de linguagem complexo precisa primeiro ser convertida em uma sequência de tokens antes de entrar no modelo. O modelo não vê "um PDF"; ele vê o conteúdo textual extraído do PDF, que é então segmentado em tokens. Portanto, o formato que resulta na menor perda de informação e no menor ruído após a conversão em texto simples é o melhor formato.

▲ A habilidade oficial de Claude para PDFs requer uma biblioteca de ferramentas dedicada para ler arquivos PDF.
O objetivo do design de PDF é "ter boa aparência quando impresso", e não "ser fácil de ler para máquinas". O que um PDF armazena internamente são as coordenadas de cada caractere, não a ordem lógica do texto. Em um PDF com layout de duas colunas, a ordem do texto analisado poderia facilmente ficar completamente desordenada: primeira linha da coluna da esquerda, primeira linha da coluna da direita, segunda linha da coluna da esquerda, segunda linha da coluna da direita.
As tabelas são ainda piores. Em PDFs, elas geralmente são blocos de texto posicionados com coordenadas absolutas, sem qualquer informação semântica como "isto é uma linha" ou "isto é uma coluna". Para analisadores de PDF com IA, elas só podem adivinhar.
Os PDFs digitalizados são ainda mais problemáticos, pois são imagens diretas e exigem primeiro o reconhecimento de texto por OCR. A taxa de erro do OCR é incorporada diretamente ao contexto do modelo.

Os arquivos .docx e .pptx são essencialmente arquivos ZIP contendo vários arquivos XML (Extensible Markup Language). O conteúdo bruto analisado contém muitas tags de estilo, como fontes, cores, espaçamento entre parágrafos, temas e histórico de revisões. Essas tags não ajudam o modelo a entender o conteúdo, mas consomem muitos tokens e diluem as informações realmente úteis.
Em apresentações de PowerPoint, a densidade de informação é inerentemente baixa. Um único slide pode conter apenas uma frase ou algumas palavras-chave, resultando em texto fragmentado sem conexões contextuais, o que dificulta a reconstrução da lógica completa pelo modelo.
Alguns podem perguntar sobre o formato TXT. Na verdade, formatos de texto como Markdown e Word podem ser convertidos em documentos TXT. Eles não possuem ruído adicional, mas também não possuem sinais estruturais.
O modelo tem dificuldades em identificar títulos, listas, blocos de código e citações. Para documentos longos, isso significa que o modelo precisa se basear em pistas de linguagem natural para adivinhar a estrutura, resultando em precisão inconsistente.

▲ Imagem gerada por IA
Linguagens semelhantes incluem JSON/XML, que de fato são mais amigáveis para máquinas, mas "máquina" não se refere ao modelo de linguagem.
JSON e XML são projetados para análise sintática por programas, apresentando pares de chave-valor, estruturas hierárquicas e sintaxe rigorosa. O software tradicional lê JSON sem problemas porque pode usar diretamente json.parse() para obter um objeto estruturado.
O "entendimento" do modelo de linguagem é alcançado por meio de associações estatísticas entre tokens. Para o modelo de linguagem, ler JSON é o mesmo que ler linguagem natural: processar token por token e estabelecer associações por meio de mecanismos de atenção. Alimentar um sistema projetado para entrada difusa com esse formato estritamente estruturado é inerentemente incompatível.
O Markdown fica algures no meio; é texto simples, mas com sinais estruturados leves.


▲ Algumas ferramentas, como o Jina Reader, podem converter qualquer página da web em Markdown compatível com LLM adicionando o prefixo r.jina.ai ao URL da página.
A análise sintática de Markdown não requer ferramentas especiais; basta ler o texto. Isso evita o caos coordenado dos PDFs e o ruído XML dos documentos do Word. Além disso, símbolos como #, ** e – fornecem ao modelo pistas estruturais suficientes, permitindo identificar seções como títulos, listas e código.
Esses símbolos já estão no vocabulário de tokens, e o modelo os processa diretamente, sem etapas de pré-processamento.
O Markdown está se tornando obsoleto?
O artigo do projeto Claude Code detalha diversas vantagens do HTML.

▲ Imagem gerada por IA
Com maior densidade de informação, o HTML pode transmitir muito mais informação do que o Markdown. Ele consegue lidar com a estrutura básica do documento e a formatação de títulos, mas também pode representar várias outras informações, como estilos CSS, imagens SVG, dados do espaço canvas, fluxogramas, imagens inseridas usando a tag `img`, e assim por diante.
Ele também mencionou que o Claude é capaz de lidar com tarefas cada vez mais complexas, e os documentos de requisitos e planos que ele gera estão ficando cada vez mais extensos. Arquivos Markdown com mais de 100 linhas são simplesmente ilegíveis, quanto mais para outras pessoas lerem.
No entanto, ler documentos HTML é muito mais fácil. Claude consegue organizar a estrutura de forma clara e navegar facilmente usando abas, ilustrações, links e muito mais. Ele consegue até mesmo criar layouts responsivos, garantindo uma leitura confortável em diferentes dispositivos.

Em relação ao compartilhamento, ele também acredita que o HTML é mais fácil de distribuir do que o Markdown. Enviar um arquivo HTML para um amigo por meio de um link tem maior probabilidade de resultar em um clique e leitura do link do que enviar um documento Markdown.
Assim como na apresentação de um relatório, você pode apresentar uma apresentação em PowerPoint com dezenas de páginas ou simplesmente abrir uma página da web. Produtos comuns de pesquisa aprofundada disponíveis no mercado também começam renderizando páginas da web em HTML ao gerar apresentações em PowerPoint.

Existe também a interatividade do HTML; podemos clicar em diferentes botões, usar controles deslizantes ou seletores para ajustar a exibição de diferentes informações.
Ao mencionar que o Markdown gera menos tokens que o HTML e leva mais tempo, ele disse que o HTML pode ser de 2 a 4 vezes mais lento que o Markdown, mas acredita que vale a pena; a expressividade aprimorada do HTML e a probabilidade significativamente maior de que ele seja realmente lido resultam em um produto final melhor.
Também tentamos converter a longa postagem de Thariq para o formato HTML. Comparada à longa captura de tela do tweet de X, a apresentação em HTML é mais amigável para o leitor.

Em relação à questão de que o HTML é mais adequado para leitura humana, as vantagens listadas no artigo parecem ser algo que o Markdown teria dificuldade em alcançar. No entanto, ainda é cedo para descrever o HTML como a nova linguagem universal para IA.
Isso significa que, no futuro, todas as nossas conversas terão que esperar que a IA gere uma página da web supostamente bem projetada e fácil de usar?
Quando conversamos com amigos, não esperamos que eles estejam todos arrumados, muito menos que passem uma hora se maquiando e nos façam esperar por eles.
Sem mencionar que a maior parte da IA com a qual os usuários interagem — ou seja, IA que não foi projetada especificamente para programação, design ou outras áreas — se comunica inteiramente por meio de conversas. Nossas conversas podem não exigir um documento HTML sofisticado; o Markdown existente é suficiente.

Neste artigo de Claude Code Engineer, o HTML também é mencionado em relação aos projetos para os quais é adequado, como, por exemplo, quando a IA precisa gerar um documento de requisitos detalhado, incluindo planejamento de projetos e exploração de diferentes soluções de design, ou revisão e compreensão visual de código, criação de protótipos interativos, como animações e efeitos de movimento, e relatórios de pesquisa, etc.
Esses cenários são inerentemente adequados para a apresentação de páginas web, portanto, usá-los para desafiar o domínio do Markdown é um tanto injusto.
O autor conclui que o HTML, como produto final entregue aos humanos pela IA, é mais legível. No entanto, ele não defende o uso do HTML como memória de trabalho ou formato contextual para IA, porque o Markdown é atualmente a única solução para toda a IA nesta área.

Será o Markdown a palavra da era da IA? Para onde irá o Markdown?
Markdown é a linguagem de trabalho da IA, o portador do contexto e o formato para transmitir informações entre agentes, mas pode não precisar ser o que o usuário vê em última instância. HTML, ou algum formato melhor no futuro, será a interface após a renderização do Markdown.
O desafio do HTML não precisa questionar a posição do Markdown; ele só precisa preencher o papel que o Markdown nunca precisou desempenhar.
O Markdown pode fazer parte do HTML. Quando conversamos com IA em uma página da web, as respostas da IA são em Markdown, que está incorporado ao HTML.
O futuro do Markdown será como um bloco de construção, incorporado ao HTML, ou até mesmo a alguma linguagem XML mais sofisticada.

▲ Imagem gerada por IA
A formatação continuará evoluindo. O HTML é o foco principal neste momento, mas apenas neste momento. O próximo estágio poderá ser um espaço 3D interativo, e o estágio seguinte poderá ser um fluxo de sinal gravado diretamente na retina.
Mas não importa o que aconteça com a interface, o back-end ainda usa Markdown. Ele não será substituído, apenas esquecido. E no mundo da tecnologia, ser esquecido por todos é justamente como um formato acaba triunfando.
Cada geração discute sobre qual será a próxima interface. Mas o que realmente sobrevive nunca é a interface, e sim o protocolo.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

