Esta nova estrutura visa finalmente definir o padrão para modelos de IA de código aberto

a-aliança-de-código-aberto-revela-definição-de-peso-aberto
ZDNET

Os desenvolvedores e líderes de código aberto e de inteligência artificial (IA) concordam que a IA de código aberto é importante. Apesar dos melhores esforços da Open Source Initiative (OSI) para criar uma definição de IA de código aberto (OSAID), ainda há muita discordância sobre o que deve ou não ser incluído num OSAID. Nascendo desse desacordo, a recém-formada Open Source Alliance (OSA) divulgou sua opinião sobre OSAID: a Open Weight Definition (OWD).

O OWD é uma nova estrutura que equilibra a integridade da IA ​​fechada e de código aberto. A estrutura foi projetada, dizem seus criadores, para enfrentar as complexidades e desafios colocados pelo rápido desenvolvimento da tecnologia de IA. O objetivo é fornecer um padrão claro para o que constitui “código aberto” em modelos de IA, especialmente modelos de linguagem de grande porte (LLMs).

Além disso: o novo modelo de IA de código aberto da DeepSeek pode superar o1 por uma fração do custo

Os pesos são componentes fundamentais na IA. Com base nos dados brutos, os pesos são os valores numéricos associados às conexões entre os nós em diferentes camadas de um programa de IA. Esses valores são determinados durante o processo de treinamento de aprendizado de máquina. Especificamente, o OWD inclui:

  1. Acessibilidade de pesos de modelo: A definição enfatiza a disponibilização de pesos de modelo para desenvolvedores e pesquisadores.
  2. Informações do conjunto de dados: Embora não exija acesso total aos dados de treinamento, a definição enfatiza a necessidade de informações detalhadas sobre o conteúdo do conjunto de dados e os métodos de coleta.
  3. Transparência da Arquitetura: A estrutura incentiva a divulgação de informações da arquitetura do modelo para facilitar melhorias e modificações

Amanda Brock, CEO da OpenUK, disse que apoia o OWD: “A Aliança está sendo impulsionada para ampliar o envolvimento entre múltiplas organizações que competem atualmente para garantir uma melhor colaboração global. Este primeiro passo de compartilhar uma abordagem para definir pesos abertos está alinhado com a desagregação da IA ​​e definir o nível de abertura do componente desagregado, mas crítico, seja ele de dados, peso ou modelo… Certamente parece ser mais prático e viável do que um pequeno grupo criando uma definição que não é adequada ao propósito. “

Este comentário final referia-se ao OSAID do OSI, ao qual Brock se opôs. Na verdade, a OSA aproveitou a questão da IA ​​de código aberto para tentar substituir a OSI. Em janeiro, seu fundador, Sam Johnston, disse em um comunicado à imprensa: “Os dados testaram os limites da Definição de Código Aberto (OSD), que é comprovada em termos de abertura, mas carece de integridade além dos componentes do código-fonte”. Ao adicionar OWD ao OSD, Johnston deseja criar um Open Source 2.0.

Além disso: o o1 da OpenAI reside mais do que qualquer modelo importante de IA. Por que isso importa

Brock acrescentou que, apesar da publicação da definição do OSAID em Outubro passado, “o OSI está ‘no início da jornada’ com a definição. Na minha opinião, isto mostra que a abordagem de tentar definir ‘IA de código aberto’ está errada. Em vez disso, deveríamos seguir esta abordagem desagregada do desafio e olhar para a “tecnologia” subjacente, incluindo os dados de formação, e o que significa ser open source não define a lei, e não deveria. para usar a tecnologia ‘fonte’, incluindo dados para qualquer finalidade.”

Brock concluiu: “A realidade e a precisão disto devem ser compreendidas na avaliação de risco e responsabilidade. Portanto, por hoje, o anúncio da Aliança de uma definição de peso aberto é bem-vindo.”

Em resposta ao anúncio do OWD, Stefano Maffulli, diretor executivo do OSI, disse: “As comunidades constroem padrões e definições. A comunidade Linux Foundation já tem uma definição de pesos abertos no Model Openness Framework.”

A Linux Foundation não é a única parte que abordou a padronização de peso aberto. A proeminente advogada de código aberto Heather Meeker também se dirigiu a eles. Meeker escreveu: “No domínio da IA, há um mal-entendido fundamental que precisa ser resolvido – a suposição de que os princípios de licenciamento de software de código aberto podem ser aplicados diretamente aos pesos líquidos neurais (NNWs). O equívoco decorre da fusão de dois artefatos diferentes — código-fonte do software e NNWs.”

Além disso: passei horas testando tarefas do ChatGPT – e sua recusa em seguir as instruções foi um pouco assustadora

Ela continuou: “Os NNWs são diferentes. Eles representam o ‘conhecimento’ que uma rede neural artificial aprendeu e muitas vezes são armazenados como grandes matrizes de números. Ao contrário do código-fonte, os NNWs não são legíveis ou depuráveis. (…) As liberdades fundamentais do código aberto – para executar, estudar, redistribuir e modificar software – não se traduz facilmente em NNWs Embora você possa executar e distribuir NNWs, estudá-los e modificá-los não é trivial ou funcional. impossível.”

Você pode compartilhar NWWs sob uma licença de estilo de código aberto, a Licença Permissiva de Pesos Abertos proposta por Meeker. Mas, como ela observou: “Esta definição concentra-se, em vez disso, na ideia original de abertura e na preservação dos objetivos originais do Freedom Zero de software livre e código aberto”.

Mafflli disse: “TheOSI está observando para ver o que os profissionais de IA realmente fazem. Assim como o trabalho do LF, as definições do OSI são desenvolvidas por e com a comunidade. Este foi o caso da definição de código aberto original que foi desenvolvida em mais de 20 anos de comunidades de software livre construindo e lançando software É o que fizemos com a IA: a comunidade liderou o processo para definir a IA de código aberto.”

Em uma entrevista, Meeker acrescentou: “Espero que os vários esforços de definição (a definição de IA de código aberto da OSI, a definição de pesos abertos que publiquei pela primeira vez em 2022 e esta nova definição) possam convergir. definições se tornarão um padrão de fato como a definição de código aberto – todas elas foram eclipsadas por estruturas regulatórias e regulamentações de privacidade díspares e por fornecedores que estão estabelecendo práticas em um mercado altamente concentrado”.

O que este debate se resume é que ainda estamos debatendo como é exatamente a IA de código aberto. É verdade que os líderes de código aberto podem concordar que simplesmente dizer que um programa ou dados de IA são de código aberto não significa que o sejam, e foi o que Meta fez com o Llama. Mas ainda não estamos nem perto de encontrar a unidade numa definição de IA de código aberto.


Rolar para cima