A obtenção de baixa latência em redes sem fio requer foco no tráfego IP de ponta a ponta – desde o dispositivo até o aplicativo, onde quer que esteja localizado (por exemplo, em um data center ou provedor de nuvem) e vice-versa. Este white paper explora como a baixa latência pode ser alcançada em diferentes aplicativos sem fio em implantações privadas de 5G, Wi-Fi e Cisco Ultra-Reliable Wireless Backhaul (URWB).
Os requisitos de latência variam
Todo mundo quer baixa latência nas redes, mas o que realmente significa baixa latência?
Em Voz sobre IP (VoIP), 150 milissegundos (ms) de latência em uma direção não é perceptível pelos usuários e, portanto, é perfeitamente aceitável. Com aplicativos como colaboração (Webex, Microsoft Teams), Office 365, mensagens e colaboração 3D com realidade aumentada e virtual (AR/VR), tempos de resposta bidirecionais abaixo de 50 ms são desejados. Da mesma forma, se você estiver usando conexões sem fio para operar um Robô Móvel Autônomo (AMR) ou um Veículo Guiado Automatizado (AGV) em uma fábrica, são necessários tempos de resposta abaixo de 20 ms em uma rede de alto rendimento, enquanto algum controle de processo tráfego de loop requer 10 ms ou menos.
No projeto de rede, alcançar a latência de IP de ponta a ponta para atender às necessidades de aplicativos específicos requer uma compreensão do fluxo de dados, tecnologias e topologia da arquitetura geral da rede. No entanto, muitas vezes os desenvolvedores específicos de tecnologia de Camada 1 e Camada 2 anunciam apenas seus próprios valores de latência, negligenciando o fator de latência de IP de ponta a ponta, que é a soma de todas as infraestruturas de Camada 1 e Camada 2 que os fluxos de IP atravessam.
A latência IP de ponta a ponta geralmente é calculada em uma direção: do dispositivo sem fio para a rede sem fio, rede de transporte IP e servidor de aplicativos (Figura 1). RTT é o cálculo da latência bidirecional (por exemplo, o tempo necessário para um ping de rede). Além disso, o tempo de processamento necessário antes que uma resposta seja enviada de volta também deve ser considerado no cálculo da latência geral.
A latência, conforme definido no 3rd Generation Partnership Project (3GPP) TR 38.913, descreve a latência do plano do usuário na interface de rádio. O foco é desde o momento em que o Protocolo de Convergência de Pacote de Dados (PDCP) de um transmissor recebe um pacote IP até quando o PDCP do receptor o recebe e o entrega às camadas superiores do plano do usuário (por exemplo, ao relé na estação base). Mas a interface de rádio e a computação do plano do usuário são apenas um segmento do que contribui para a latência total do fluxo IP.
Os esforços do 3GPP relacionados à latência do 5G têm se concentrado em reduzir e controlar o tempo gasto pelo tráfego na rede de rádio. Embora os números de destino de latência tenham sido definidos dependendo do tipo de serviço sem fio (como eMBB ~4 ms ou URLLC ~1 ms) para uma taxa de transferência de fluxo de dados específica, atrasos e perda de taxa de transferência de várias funções de rede devem ser levados em consideração ao projetar redes, como reais a latência será maior em operações típicas.
Assim como o 3GPP, o grupo de trabalho IEEE 802.11 procura melhorar os aspectos determinísticos do protocolo Wi-Fi. Um estudo recente de Wi-Fi determinístico avaliou a latência das versões Wi-Fi existentes e como os aprimoramentos podem ser disponibilizados nas especificações IEEE 802.11be ou Wi-Fi 7 em andamento (Figura 2). Essa evolução de aprimoramentos, que também demonstra a necessidade de colaboração entre fornecedores, foi projetada para atender aos novos requisitos de aplicativos industriais (por exemplo, para aplicativos AMR e AR/VR) com o design de rede correto do segmento Wi-Fi.
Cada padrão de tecnologia sem fio tenta melhorar as características de rádio da solução, mas cada um representa apenas um dos muitos aprimoramentos a serem considerados em um projeto de rede.
Proximidade e latência da nuvem e do data center
Ao calcular a latência de IP de ponta a ponta, é importante considerar a latência típica de tempo de ida e volta (RTT) entre um usuário final e um provedor de nuvem ou provedor de serviços de rede de distribuição de conteúdo (CDN), conforme mostrado na Figura 1. Em um projeto de rede visando 150 ms de latência RTT, a divisão de tempo entre cada segmento de rede ou bloco de construção do dispositivo local para sua aplicação deve ser estimada. Um dispositivo se conecta a uma rede sem fio local com sua latência over-the-air e, em seguida, os dados são transmitidos pela infraestrutura IP pública e privada, incluindo switches, roteadores e firewalls no caminho de ida e volta. Isso geralmente significa que os dados incorrem em latência de internet imprevisível antes de chegar ao aplicativo.
Alcançar uma latência RTT mais baixa é simplificado com a maior proximidade dos aplicativos que hospedam os dispositivos sem fio. Na calculadora da Figura 3, o RTT por meio de links de fibra é estimado, o que nos ajuda a entender o atraso adicional adicionado por meio de caminhos típicos de fibra ótica ao se comunicar com aplicativos de nuvem ou data center. Se um projeto de rede visar menos de 10 ms de latência RTT por meio da infraestrutura de transporte IP, é necessária a seleção de um provedor de nuvem gerenciado, que ofereça serviços de data center localizados a 200 quilômetros do local do dispositivo. O exemplo da Figura 3 é baseado na França, que exige pelo menos 10 datacenters regionais para essa cobertura, sem considerar a movimentação de dados e aplicativos na nuvem.
Este exemplo ilustra perfeitamente por que atingir uma latência de IP de ponta a ponta mais baixa (como 5 ms) para computação de ponta é um componente obrigatório da hospedagem de aplicativos que deve ser colocado em campi ou data centers regionais.
Aqui está a aparência das arquiteturas de baixa latência em implantações privadas de 5G, Wi-Fi 6/6E e Cisco URWB.
Alcançando baixa latência com 5G privado
Em diferentes tipos de serviço 5G, as especificações 3GPP diferenciam a implementação para cada tipo de serviço ao discutir os recursos de latência, incluindo as características típicas de fluxo de dados usadas para definir os valores de destino de latência. Banda larga móvel aprimorada 5G (eMBB) oferece suporte a casos de uso orientados por largura de banda, como vídeo de alta definição (4K/8K) que exigem altas taxas de dados (> 1 Gbps) para uma determinada área de cobertura e número de usuários e dispositivos. As comunicações 5G ultra confiáveis de baixa latência (URLLC) destinam-se a atender comunicações em tempo real para casos de uso industrial que exigem latência de ponta a ponta inferior a 5 ms e um tempo de atividade de 99,9999%.
Essas soluções 5G avançadas incluem otimizações em cada etapa do hardware de rádio e processos de transmissão de uplink e downlink. Novos recursos de rádio abordam comunicações de baixa latência, permitindo um Intervalo de Tempo de Transmissão (TTI) variável que pode escalar de 1 ms até ~140 microssegundos, dependendo se a eficiência espectral em eMBB ou baixa latência em URLLC é o objetivo principal.
Em uma topologia 5G privada dentro de uma fábrica, conforme mostrado na Figura 4, um robô industrial conectado à Rede de Acesso por Rádio (RAN) é mostrado no canto inferior esquerdo. Depois que os pacotes IP saem do robô, eles são encapsulados dentro de um túnel e os dispositivos intermediários não veem os pacotes IP, mas reconhecem o encapsulamento da camada MAC.
Os pacotes IP saem do túnel na User Plane Function (UPF). O UPF é o ponto de interconexão entre a infraestrutura móvel e a rede de dados (ou seja, encapsulamento e desencapsulamento do protocolo de encapsulamento General Packet Radio Service [GPRS] para o plano do usuário). Os pacotes são então roteados para o aplicativo, localmente ou para um centro de dados ou um serviço de nuvem na Internet. Um benefício é que o UPF pode ser distribuído, permitindo que um UPF central sirva como âncora para a rede geral, enquanto o UPF local pode ser implantado em um site para reduzir o caminho para os aplicativos locais.
Novamente, a localização dos provedores de nuvem ou data centers da empresa tem um grande impacto na latência. Quanto mais próximos estiverem dos dispositivos finais, menor será a latência. A latência resulta de um caminho completo por todos esses dispositivos.
Além do UPF distribuído, uma função Multiaccess Edge Computing (MEC) é definida para lidar melhor com os serviços de aplicativos locais. Os túneis são terminados em centros de dados locais menores, mais próximos do rádio celular. Essa abordagem pode eliminar atrasos de rede de latência de ponta a ponta porque o tráfego não está voltando para um centro de dados central ou para a Internet, alcançando, portanto, menos de 10 ms para aplicativos críticos.
Alcançando baixa latência com Wi-Fi
Os padrões IEEE 802.11 estão evoluindo rápida e continuamente, com a versão mais recente – abrangendo Wi-Fi 6 e 6E – aumentando a capacidade e a largura de banda da rede e reduzindo a latência (Figura 2). Embora o Wi-Fi opere em bandas não licenciadas, ele é estritamente regulamentado pelos países. Os regulamentos locais definem os níveis máximos de potência dos pontos de acesso para evitar interferência entre os usuários. Isso, por sua vez, determina alcance, cobertura, penetração e força do sinal. Conforme discutido anteriormente, espera-se que a próxima geração do protocolo Wi-Fi aprimore seu determinismo, permitindo um melhor controle de latência em um projeto de rede.
O Wi-Fi e o 5G usam diferentes tipos de encapsulamento, mas os pacotes IP em uma rede W-Fi também se movem dos pontos de acesso para a rede de rádio sem fio e através de túneis para um controlador de LAN sem fio (WLC). Em um projeto de rede, o caminho IP de ponta a ponta para aplicativos em uma nuvem ou centro de dados do WLC é idêntico ao do caso de uso 5G, pois é independente da tecnologia sem fio selecionada. Da mesma forma, para implementações 5G privadas, se baixa latência for necessária para um aplicativo, um Wi-Fi WLC para o caminho do servidor de aplicativos deve ser projetado para produzir um caminho que seja o mais curto possível.
Um dos principais benefícios das arquiteturas Wi-Fi é a capacidade de fazer comutação local sem atingir um WLC (Figura 5), outro fator que pode contribuir para diminuir a latência em um projeto.
Alcançando baixa latência com backhaul wireless ultra confiável da Cisco
Cisco Ultra-Reliable Wireless Backhaul (Cisco URWB) é uma tecnologia de backhaul de WAN sem fio derivada de Wi-Fi e projetada para atender ambientes de rede móvel, como trens, ônibus, metrôs, guindastes controlados remotamente, AGVs e AMRs. Também pode ser implantado como uma infraestrutura fixa, fornecendo backhaul onde a fibra não pode ir ou é muito cara. O Cisco URWB é especialmente adequado para conectividade entre redes móveis (como veículos) e uma infraestrutura fixa, otimizada para mover rapidamente as comunicações do dispositivo móvel dentro de uma infraestrutura sem fio fixa antes de interromper. As redes Cisco URWB podem ser projetadas para casos de uso da Camada 2 (como AGVs ou AMRs em um centro de distribuição), bem como casos de uso da Camada 3 (como metrôs), permitindo a mobilidade da rede em vários locais a alguns quilômetros de distância.
A tecnologia Cisco URWB fornece conexões de baixa latência, altamente confiáveis, de longo alcance e de alta largura de banda que podem lidar com terminais que se movem em altas velocidades com transferências sem atraso. Operando em frequências não licenciadas, o segmento Cisco URWB requer um design adequado para controlar a latência e o handover rápido em menos de 5 ms, enquanto a infraestrutura IP ponta a ponta que começa no gateway Cisco URWB é como as topologias Wi-Fi e 5G.
Aprimoramentos recentes foram feitos no Cisco URWB para fornecer conectividade ininterrupta a dispositivos de movimentação rápida, enviando pacotes de alta prioridade por meio de caminhos redundantes. A tecnologia Multipath Operations (MPO) patenteada pela Cisco pode duplicar o tráfego protegido em até 8x e evitar caminhos comuns, e funciona junto com a disponibilidade de hardware para menor latência e maior disponibilidade, limitando a interferência e falhas de hardware.
Uma topologia Cisco URWB é mostrada na Figura 6. A camada integrada na parte inferior representa um veículo que contém um rádio conectado a uma estação base. Os dados do veículo são encapsulados em um controlador centralizado e então desencapsulados como pacotes IP na rede IP. Mais uma vez, níveis mais baixos de latência podem ser obtidos por aplicativo movendo o data center ou o provedor de nuvem para mais perto do dispositivo final.
Conclusão
A adoção de um determinado tipo de rede sem fio depende da estratégia de cada empresa e dos casos de uso operacional. No entanto, nenhuma das tecnologias sem fio pode atingir baixa latência sem o projeto de rede adequado. A latência de rádio deve ser estimada no contexto da latência IP de ponta a ponta e do atraso de ida e volta, enquanto os requisitos de cada aplicativo devem ditar o design da rede. Muitos fatores diferentes contribuem para reduzir a latência. Mas um que é compartilhado por 5G, Wi-Fi e Cisco URWB é a proximidade de aplicativos, seja local, em data centers ou em nuvens onde os dados estão sendo processados.
Seja no chão de uma fábrica, em um centro de pesquisa universitário, em um trem de alta velocidade ou em uma filial, quanto melhor o projeto da rede, menor a provável latência do serviço.
E para um melhor projeto de sua rede, conte com nossa equipe especializada. Faça contato conosco.