Propaganda
o Arquivo é um dos a partes fundamentais da experiência de computação. Mas o que é um “arquivo” de qualquer maneira? É um ícone em sua área de trabalho, uma entrada em uma lista que abre seu orçamento como uma planilha e um nome que você pode dar à sua selfie mais recente. No final das contas, um “arquivo” é uma coleção de bits (zeros e uns) organizados em um padrão que algum aplicativo entende.
Os desenvolvedores podem manter esses padrões em segredo, o que pode fazer com que os usuários mantenham um determinado programa apesar das alternativas O guia completo do conversor de arquivos do Microsoft OfficeSe você já converteu um arquivo de texto, como PDF para Word, está familiarizado com o desafio. Às vezes é tão fácil quanto imprimir, outras vezes você precisa de ferramentas especiais. Acesse este guia do conversor. consulte Mais informação . Outros desenvolvedores podem até encorajar a adoção de seus formatos. Em alguns casos, você pode conseguir abrir e interpretar o formato facilmente ou pode ser impossível usá-lo fora de seu aplicativo nativo. Exploraremos exemplos de todos os itens acima neste artigo.
Baseado em texto vs. Formatos de arquivo binário
O primeiro aspecto importante dos diferentes tipos de arquivo é se ele é binário ou baseado em texto. Vejamos cada um deles separadamente.
Formatos baseados em texto
O arquivo de texto é o formato de arquivo mais básico que existe. Ele pode ser lido por praticamente qualquer sistema com processador. Este formato é uma sequência de bits (uns e zeros) que segue o padrão ASCII (vamos ignorar Unicode por enquanto), o que significa que um computador pode interpretar cada byte (8 bits) como um caractere dentre os Segue:
- A-Z (incluindo maiúsculas e minúsculas
- 0-9
- Personagem de espaço
- Uma seleção de símbolos (por exemplo, pontuação)
- Caracteres de controle (por exemplo, “DEL”)

Uma vez que os dados são armazenados como texto, você pode ver o conteúdo de um arquivo abrindo-o em um editor de texto, mesmo os mais simples como o Bloco de notas do Windows 2 editores de texto minimalistas que você provavelmente nunca ouviu falar [Windows]Além de serem baseados preferencialmente em tempos de carregamento rápidos, alguns aplicativos simplesmente não requerem muitos recursos que consomem muitos recursos. Os aplicativos minimalistas são pequenos e limpos e, contanto que façam o trabalho, você ... consulte Mais informação (ou equivalentes para Mac Os melhores editores de texto HTML para o seu MacPrecisa de um novo editor de texto para o seu Mac? Analisamos os melhores editores de texto HTML gratuitos e pagos para macOS. consulte Mais informação , Linux Editores de texto avançados do Linux comparados: kate vs geditQualquer usuário Linux dirá que um bom editor de texto é um componente vital de um sistema de computador, não importa se você é um novo usuário ou um profissional experiente. Ao usar um texto de Terminal ... consulte Mais informação , iOS Write App: Um belo editor de texto iOS com suporte a Markdown e dezenas de açõesAplicativos de escrita para o iPad e iPhone são abundantes. Temos sorte de viver em uma época em que os desenvolvedores estão criando novas maneiras de editar texto usando recursos exclusivos em novos aplicativos. Esse... consulte Mais informação , e Android Comparação de 7 editores de texto sem distração para Android: qual é o melhor?Faça um trabalho real em seu dispositivo Android usando um desses editores de texto incríveis. consulte Mais informação ). Como quase todas as plataformas de computação vêm com um editor de texto básico, você pode colocar algumas informações (de texto) em um desses arquivos e ter certeza de que sempre poderá acessá-lo. Outros aplicativos não precisam saber mais nada para pelo menos ler os dados corretamente.
No entanto, as coisas ficam mais complicadas quando você precisa representar algo como a fonte do texto ou uma data preenchida automaticamente na página de rosto. Nestes casos, os caracteres ASCII contribuem para um formato baseado em texto tal como Markdown O que é Markdown? 4 razões pelas quais você deve aprender agoraCansado de editores de HTML e WYSIWYG? Então Markdown é a resposta para você, não importa quem você seja. consulte Mais informação ou XML. Embora isso confira os benefícios do texto simples, como transparência, esses arquivos geralmente requerem mais espaço para elementos como tags. Considere o seguinte arquivo de uma frase em texto simples e, em seguida, no formato "Flat ODT" (FODT) do Open Document Format, que usa XML. A imagem abaixo mostra que a versão em texto simples tem 53 bytes, enquanto a versão ODT é 25.000 bytes.

Formatos Binários
Em contraste, formatos binários O que é binário? [Tecnologia explicada]Dado que o binário é tão absolutamente fundamental para a existência de computadores, parece estranho que nunca tenhamos abordado o assunto antes - então hoje eu pensei em dar uma breve visão geral de que binário ... consulte Mais informação são arquivos que um aplicativo irá construir aos poucos. Você pode tentar abrir esses arquivos com um editor de texto, mas provavelmente não saberá como interpretá-los. O seguinte mostra o resultado da tentativa de abrir um arquivo do Microsoft Excel com um editor de texto.

O aplicativo precisa processar os dados em um arquivo binário de uma maneira específica. Ao abrir um arquivo XLS, um aplicativo deve tratar os primeiros dezesseis bytes do arquivo como o marcador de “início do arquivo” (BOF). Dentro desse marcador, o quinto item é um único bit que indica se o arquivo foi editado ou não pela última vez na plataforma Windows (“fWin”). Vem depois de outros quatro itens, cada um de dois bytes, o que significa que o item “fWin” é o 65º bit no arquivo Excel.

Como vimos, se você tentar abri-lo com um aplicativo que não trata o 65º bit como o sinalizador “fWin”, esse aplicativo não o abrirá corretamente. Ele pode exibir muitos caracteres ilegíveis na tela (mostrado acima), lidar com isso normalmente com uma mensagem de erro (também mostrada acima, devido ao Linux) ou travar. Em qualquer caso, ele não saberá ler os dados corretamente e, portanto, não os exibirá corretamente. Mas os aplicativos, uma vez programados, podem lidar com tantos formatos de arquivo quantos desejar.
Aberto vs. Formatos Proprietários
A próxima consideração é se um formato de arquivo é aberto (ou seja, está disponível para uso fácil por outros) ou proprietário. Observe que “proprietário” não é o mesmo que fechado, pelo menos não em todos os casos. Enquanto o “texto vs. binário ”o debate acima era técnico,“ aberto vs. proprietário ”tem mais a ver com os termos de licenciamento de um formato de arquivo. Mais sobre isso nas seções a seguir.
Formatos Abertos
Formatos abertos são aqueles em que a licença permite que os usuários os adotem em seus próprios aplicativos. Um corpo de padrões de algum tipo também deve supervisionar seu desenvolvimento contínuo por uma comunidade de colaboradores para os formatos para seja verdadeiramente “aberto”. Os formatos abertos também não têm custos de licenciamento e restrições - podem ser usados por qualquer pessoa, para qualquer finalidade. Talvez o formato aberto mais famoso seja o formato de documento aberto (ODF) 9 formatos de arquivo do Office raros que você deve conhecerVocê já se deparou com formatos de arquivo estranhos em sua suíte de escritório? Forneceremos uma introdução rápida sobre tipos de arquivos de escritório raros, mas úteis, e para que você pode usá-los. consulte Mais informação , lançado pela primeira vez em 2005 por OÁSIS. Seu objetivo era oferecer uma alternativa ao bloqueio que a Microsoft tinha no mercado de produtividade.
Com formatos abertos, você nunca precisa temer que suas informações fiquem bloqueadas em um arquivo específico. Considere o seguinte, que mostra nosso arquivo de formato Flat ODT. Embora haja muitas informações estranhas sobre isso, você pode ver os dados reais lá, claros como o dia.

Outro benefício dos formatos abertos é sua documentação completa. Uma coisa é um arquivo ser facilmente legível. Um programador ainda precisará (por tentativa e erro) descobrir o que exatamente cada recurso faz. Mas, no caso do ODF, o especificação da versão 1.2 oferece a um programador tudo o que ele precisa saber para implementar o suporte de forma eficiente.
Formatos Proprietários
Por último, os formatos proprietários são protegidos por seus desenvolvedores. Pode ser porque eles incluem segredos comerciais, para fins de segurança (percebida), ou simplesmente porque o desenvolvedor não deseja compartilhar seu trabalho. Seja qual for o motivo, esses formatos são proprietários em virtude de Contratos de licença de usuário final (EULAs) ou outros termos que proíbam o usuário de tentar fazer engenharia reversa ou de outra forma “quebrar” o formato do arquivo.
Antes apenas "proibido", o Lei de Direitos Autorais do Milênio Digital O que é a Lei de Direitos Autorais de Mídia Digital? consulte Mais informação (DCMA) mudou as coisas. Os desenvolvedores agora têm o apoio legal para perseguir aqueles que fazem a engenharia reversa de seu trabalho. Você deve pensar no futuro antes de investir em um aplicativo que usa um formato proprietário. Você precisará migrar essas informações para outro lugar no futuro? Em caso afirmativo, quão doloroso será? A empresa ainda estará aí em um ou cinco anos? Você deve considerar se os recursos de um aplicativo valem a pena se isso também significar ficar preso a esse desenvolvedor devido a formatos proprietários.
Exemplos de formatos de arquivo
Se você olhar para o acima, algumas combinações irão saltar para você. É verdade que os formatos de arquivo baseados em texto se prestam a ser abertos. Da mesma forma, se o objetivo de um formato é ser proprietário, é mais fácil mantê-lo assim tornando-o binário. Mas nem sempre é o caso.
O formato de imagem XCF do GIMP é um formato aberto que também é binário. O projeto inclui um descrição detalhada de como o formato contém os gráficos, texto e camadas que constituem um arquivo GIMP como bits e bytes brutos (mostrado abaixo). Os desenvolvedores podem usar isso para codificar sua própria implementação para que aplicativos externos como o ImageMagick Como cortar e redimensionar imagens facilmente no LinuxSe você quiser fazer alguns cortes e redimensionamentos básicos no Linux - talvez para ajudar em um projeto ou tornar uma imagem mais fácil de carregar em suas redes sociais favoritas - tente estes ... consulte Mais informação kit de ferramentas pode importá-los.

Por outro lado, o formato mais recente do Microsoft Visio (VSDX) é um formato baseado em XML (e, portanto, baseado em texto). Isto publica uma referência detalhada da composição desses arquivos. No entanto, o documento de referência observa que a Microsoft “possui patentes que podem cobrir sua implementação” do suporte .VSDX. Além disso, o Biblioteca do Congresso afirma que o uso da especificação VSDX “não garante licença livre de royalties de todas as patentes relevantes” se você usá-la. Esta é outra maneira de dizer que você pode lançar os dados e incluir esse suporte. Mas a Microsoft pode querer ou não que você pague por ele mais tarde, dependendo de quão próximo ele concorre com o Visio.
Se você acha que eles são complicados, que tal o formato ODT não plano. É um arquivo em formato ZIP (binário e aberto, a menos que você também esteja usando sua criptografia) que contém o texto de um documento (content.xml, formato baseado em texto aberto) e gráficos (por exemplo, PNG, binário, mas aberto).

Quão importantes são os formatos de arquivo, realmente?
Esta é uma pergunta difícil. Por um lado, alguns sistemas operacionais como o iOS tentaram isolar os usuários de lidar com arquivos. Você tem o aplicativo que criou o arquivo para abri-lo, quem se importa com sua estrutura ou com o que é sua extensão? Mesmo assim, muitas organizações (especialmente governos) têm pressionado para garantir que os dados públicos estejam em um formato aberto.
Se você é um idealista de software (não que haja algo errado com isso), então, ao avaliar novos aplicativos, certifique-se de que eles estejam em um formato aberto (de preferência) baseado em texto. Se você quer apenas trabalhar, os formatos proprietários podem não ser um problema para você.
O que você acha? Você exige que suas informações residam em formatos abertos e baseados em texto que você possa converter e verificar? Ou os formatos que os desenvolvedores usam, proprietários ou não, são suficientes para você? Deixe-nos saber abaixo nos comentários!
Créditos de imagem: Edilus / Shutterstock
Aaron está envolvido em tecnologia como analista de negócios e gerente de projeto há quinze anos, e é um usuário fiel do Ubuntu há quase o mesmo tempo (desde o Breezy Badger). Seus interesses incluem software livre, aplicativos para pequenas empresas, integração de Linux e Android e computação em modo de texto simples.