WideLabs e NVIDIA lançam base de dados para IA em português brasileiro
A WideLabs e a NVIDIA lançaram o Nemotron Personas Brasil, um conjunto de dados sintético aberto desenvolvido para apoiar a criação de soluções de inteligência artificial mais alinhadas ao contexto brasileiro. A iniciativa posiciona o português brasileiro entre os idiomas contemplados pelo programa global da NVIDIA de bases abertas e estruturadas para IA.O projeto reúne personas sintéticas — perfis fictícios, porém realistas — criadas a partir de estatísticas oficiais do país, como dados do IBGE. As personas combinam informações demográficas, regionais e socioeconômicas, incluindo faixa etária, nível de escolaridade, ocupação, interesses e aspectos do cotidiano, com o objetivo de representar a diversidade cultural e social do Brasil.
O Nemotron Personas Brasil faz parte do programa global Nemotron Personas, iniciativa da NVIDIA voltada à criação de conjuntos de dados abertos de “pessoas virtuais”. Esses dados são utilizados para treinar, testar e ajustar sistemas de IA, permitindo que modelos compreendam melhor como diferentes perfis populacionais se expressam, interagem e tomam decisões.
IA alinhada ao contexto nacional
Com o lançamento, o português brasileiro passa a integrar o grupo de idiomas contemplados por bases abertas e estruturadas dentro do programa da NVIDIA, ao lado de mercados como Estados Unidos, Japão e Índia. O movimento é considerado um marco para o ecossistema nacional de inteligência artificial, ao ampliar a disponibilidade de dados locais para o desenvolvimento de soluções mais contextualizadas.A base foi concebida para atender empresas que desenvolvem assistentes virtuais, copilotos e agentes de IA voltados ao público brasileiro, além de órgãos públicos, universidades e centros de pesquisa que buscam maior transparência, responsabilidade e aderência ao contexto nacional no uso da tecnologia.
“Construir inteligência artificial no Brasil exige mais do que traduzir sistemas desenvolvidos em outros mercados. É necessário compreender pessoas, contextos e realidades locais”, afirma Nelson Leoni, CEO da WideLabs. Segundo ele, o Nemotron Personas Brasil foi criado para oferecer uma base aberta que reflita a diversidade do país e sirva de referência para o desenvolvimento de soluções mais adequadas ao português brasileiro.

Imagem: Divulgação
Nelson Leoni, CEO da WideLabs
Adaptação local e metodologia global
No projeto, a WideLabs atuou como parceira responsável pela adaptação do Nemotron Personas ao contexto brasileiro. A empresa liderou a construção da base demográfica, a localização linguística para o português brasileiro e a adequação cultural das personas, seguindo a metodologia global definida pela NVIDIA.Para a NVIDIA, a iniciativa contribui para fortalecer o ecossistema local de inovação e facilitar a adaptação de soluções globais ao mercado brasileiro. “Disponibilizar um conjunto de dados aberto, construído a partir de dados oficiais, ajuda desenvolvedores a criar sistemas de IA que se comuniquem de forma mais natural e relevante para o Brasil”, afirma Jomar Silva, gerente de relacionamento com desenvolvedores da NVIDIA para a América Latina.
Aplicações práticas e uso responsável
O lançamento ocorre em um momento em que empresas e instituições avançam além de chatbots básicos, em direção a sistemas de IA mais abrangentes, capazes de apoiar decisões, executar tarefas complexas e interagir continuamente com usuários. Nesse cenário, a qualidade e a adequação dos dados utilizados no treinamento dos modelos tornam-se fatores críticos.Antes da disponibilização de uma base estruturada voltada especificamente ao Brasil, muitas equipes recorriam a traduções de outros mercados ou a textos genéricos em português, o que dificultava a representação consistente da diversidade nacional. O Nemotron Personas Brasil busca preencher essa lacuna, permitindo, por exemplo, avaliar como um assistente digital se comunica com públicos de diferentes regiões, faixas etárias e níveis de escolaridade.
Dados abertos e integração ao ecossistema NVIDIA
Assim como os demais conjuntos do programa Nemotron Personas, a base brasileira será disponibilizada sob licença CC BY 4.0, permitindo uso amplo mediante atribuição. O conjunto foi desenvolvido para integração com o ecossistema de ferramentas da NVIDIA voltadas à criação, teste e aprimoramento de soluções de inteligência artificial.Com isso, a iniciativa amplia o acesso a dados de alta qualidade em português brasileiro e contribui para o desenvolvimento de aplicações de IA mais alinhadas à realidade nacional, apoiando empresas, startups, instituições públicas e pesquisadores em projetos voltados a aplicações do mundo real. Leia a revista