Dados da Jin10, 10 de julho: na madrugada de hoje, a Microsoft lançou no seu site a versão mais recente da família Phi-4, Phi-4-mini-flash-reasoning. A versão mini-flash mantém as características de parâmetros pequenos e alto desempenho da família Phi-4, sendo projetada especificamente para cenários limitados por poder de computação, memória e latência, podendo ser executada em uma única GPU, adequada para dispositivos de borda como notebooks e tablets. Em comparação com a versão anterior, a mini-flash utiliza a arquitetura inovadora SambaY desenvolvida pela Microsoft, com a eficiência de raciocínio subindo 10 vezes, a latência média reduzida em 2 a 3 vezes, e um aumento significativo no desempenho geral de raciocínio.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Microsoft lança a nova versão do Phi-4 em Código aberto: eficiência de inferência sobe 10 vezes, pode ser executado em notebooks.
Dados da Jin10, 10 de julho: na madrugada de hoje, a Microsoft lançou no seu site a versão mais recente da família Phi-4, Phi-4-mini-flash-reasoning. A versão mini-flash mantém as características de parâmetros pequenos e alto desempenho da família Phi-4, sendo projetada especificamente para cenários limitados por poder de computação, memória e latência, podendo ser executada em uma única GPU, adequada para dispositivos de borda como notebooks e tablets. Em comparação com a versão anterior, a mini-flash utiliza a arquitetura inovadora SambaY desenvolvida pela Microsoft, com a eficiência de raciocínio subindo 10 vezes, a latência média reduzida em 2 a 3 vezes, e um aumento significativo no desempenho geral de raciocínio.