Em 2020, a Apple fez uma jogada ousada; eles abandonaram a Intel e mudaram para seu silício proprietário para alimentar seus MacBooks. Embora a mudança para a arquitetura ARM da linguagem de design x86 tenha levantado várias sobrancelhas, a Apple provou que todos estavam errados quando os MacBooks com silício da Apple ofereceram um desempenho alucinante por watt.

De acordo com vários especialistas, a mudança para a arquitetura ARM foi um grande motivo para o aumento no desempenho/watt. No entanto, a nova Arquitetura de Memória Unificada também desempenhou um papel crucial na melhoria do desempenho da nova geração de MacBooks.

Então, o que é a Arquitetura de Memória Unificada da Apple e como ela funciona? Bem, vamos descobrir.

Por que seu computador precisa de memória?

Antes de entrar na arquitetura de memória unificada da Apple, é essencial entender por que os sistemas de armazenamento primário como a memória de acesso aleatório (RAM) são necessários em primeiro lugar.

Veja, um processador tradicional roda a uma velocidade de clock de 4 GHz durante um

turbo boost. Nessa velocidade de clock, um processador pode executar tarefas em um quarto de nanossegundo. No entanto, as unidades de armazenamento, como SSDs e HDDs, só podem fornecer dados para a CPU a cada dez milissegundos, ou seja, 10 milhões de nanossegundos. Isso significa que no tempo entre a CPU terminar de processar os dados em que está trabalhando e receber o próximo lote de informações, ela fica ociosa.

Isso mostra claramente que as unidades de armazenamento não conseguem acompanhar a velocidade do processador. Os computadores resolvem esse problema usando sistemas de armazenamento primário como RAM. Embora esse sistema de memória não possa armazenar dados permanentemente, ele é muito mais rápido quando comparado aos SSDs – ele pode enviar dados em apenas 8,8 nanossegundos: infinitamente mais rápido que os SSDs mais rápidos atualmente.

Esse baixo tempo de acesso permite que a CPU receba dados mais rapidamente, permitindo que ela processe continuamente as informações em vez de esperar que o SSD envie outro lote para processamento.

Devido a esta arquitetura de design, os programas nas unidades de armazenamento são movidos para a RAM e então acessados ​​pela CPU através dos registradores da CPU. Portanto, um sistema de armazenamento primário mais rápido melhora o desempenho de um computador, e é exatamente isso que a Apple está fazendo com sua Arquitetura de Memória Unificada.

Entendendo como funcionam os sistemas de memória tradicionais

Agora que sabemos por que a RAM é necessária, precisamos entender como a GPU e a CPU a utilizam. Embora a GPU e a CPU sejam projetadas para processamento de dados, a CPU é projetada para realizar cálculos de propósito geral. Pelo contrário, a GPU é projetada para executar a mesma tarefa em diferentes núcleos. Devido a essa diferença de design, a GPU é altamente eficiente no processamento e renderização de imagens.

Embora a CPU e a GPU tenham arquiteturas diferentes, elas dependem de sistemas de armazenamento primário para obter dados. Existem dois tipos de memórias de acesso aleatório em um sistema tradicional com uma GPU dedicada. Esta é a VRAM e a RAM do sistema. Também conhecida como Video RAM, a VRAM é responsável por enviar os dados para a GPU, e a RAM do sistema transfere os dados para a CPU.

Mas para entender melhor os sistemas de gerenciamento de memória, vejamos um exemplo real de você jogando um jogo.

Quando você abre o jogo, a CPU entra em cena e os dados do programa do jogo são movidos para a RAM do sistema. Depois disso, a CPU processa os dados e os envia para a VRAM. A GPU então processa esses dados e os envia de volta à RAM para que a CPU exiba as informações na tela. Nos casos de um sistema de GPU integrado, ambos os dispositivos de computação compartilham a mesma RAM, mas acessam diferentes espaços na memória.

Essa abordagem tradicional envolve muita movimentação de dados, tornando o sistema ineficiente. Para resolver esse problema, a Apple usa a Arquitetura de Memória Unificada.

Como funciona a arquitetura de memória unificada no Apple Silicon?

A Apple faz várias coisas de maneira diferente quando se trata de sistemas de memória.

No caso de sistemas genéricos, a RAM é conectada à CPU usando um soquete na placa-mãe. Essa conexão afunila a quantidade de dados enviados para a CPU.

Por outro lado, silicone de maçã usa o mesmo substrato para montar a RAM e o SoC. Embora a RAM não faça parte do SoC em tal arquitetura, a Apple usa um substrato interposer (Fabric) para conectar a RAM ao SoC. O interposer nada mais é do que uma camada de silício entre o SOC e a RAM.

Comparado aos soquetes tradicionais, que dependem de fios para transferir dados, o interposer permite que a RAM se conecte ao chipset usando vias de silício. Isso significa que os MacBooks movidos a silício da Apple têm sua RAM incorporada diretamente no pacote, tornando mais rápida a transferência de dados entre a memória e o processador. A RAM também está fisicamente mais próxima de onde os dados são necessários (os processadores), permitindo que os dados cheguem onde são necessários mais cedo.

Devido a essa diferença na conexão da RAM ao chipset, ele pode acessar altas larguras de banda de dados.

Crédito da imagem: Maçã

Além da diferença mencionada acima, a Apple também mudou a forma como a CPU e a GPU acessam o sistema de memória.

Conforme explicado anteriormente, a GPU e a CPU têm pools de memória diferentes nas configurações tradicionais. A Apple, pelo contrário, permite que a GPU, CPU e Neural Engine acessem o mesmo pool de memória. Devido a isso, os dados não precisam ser transferidos de um sistema de memória para outro, melhorando ainda mais a eficiência do sistema.

Devido a todas essas diferenças na arquitetura de memória, o Unified Memory System oferece alta largura de banda de dados para o SoC. Na verdade, o M1 Ultra oferece uma largura de banda de 800 GB/s. Essa largura de banda é substancialmente maior quando comparada a GPUs de alto desempenho como o AMD Radeon RX 6800 e 6800XT, que oferecem uma largura de banda de 512 GB/s.

Essa alta largura de banda permite que a CPU, a GPU e o Neural Engine acessem grandes pools de dados em nanossegundos. Além disso, a Apple usa módulos de RAM LPDDR5 com clock de 6400 MHz na série M2 para fornecer dados em velocidades surpreendentes.

Quanta memória unificada você precisa?

Agora que temos um entendimento básico da Arquitetura de Memória Unificada, podemos ver quanto dela você precisa.

Embora a Arquitetura de Memória Unificada ofereça várias vantagens, ela ainda apresenta algumas falhas. Em primeiro lugar, a RAM está conectada ao SoC, portanto, os usuários não podem atualizar a RAM em seu sistema. Além disso, a CPU, GPU e Neural Engine acessam o mesmo pool de memória. Devido a isso, a quantidade de memória exigida pelo sistema aumenta drasticamente.

Portanto, se você é alguém que navega na Internet e usa uma tonelada de processadores de texto, 8 GB de memória seriam suficientes para você. Mas se você usa programas da Adobe Creative Cloud com frequência, obter a variante de 16 GB é uma opção melhor, pois você terá uma experiência mais suave na edição de fotos, vídeos e gráficos em sua máquina.

Você também deve considerar o M1 Ultra com 128 GB de RAM se estiver treinando muitos modelos de aprendizado profundo ou trabalhando em cronogramas de vídeo com toneladas de camadas e imagens em 4K.

A arquitetura de memória unificada é para o bem?

A arquitetura de memória unificada no silício da Apple faz várias alterações nos sistemas de memória em um computador. Desde mudar a forma como a RAM é conectada às unidades computacionais até redefinir a arquitetura de memória, a Apple está mudando a forma como os sistemas de memória são projetados para melhorar a eficiência de seus sistemas.

Dito isso, a nova arquitetura cria uma condição de corrida entre a CPU, a GPU e o Neural Engine, aumentando a quantidade de RAM que o sistema precisa.