7 pontos por sigridjineth 2024-12-25 | Ainda não há comentários. | Compartilhar no WhatsApp

Em 2024, a comunidade Instruct Korea https://instruct.kr, junto com o lançamento do leaderboard LogicKor, tornou-se uma das maiores comunidades de código aberto de modelos de linguagem da Coreia, com cerca de 700 pesquisadores compartilhando voluntariamente seus resultados.

Com a chegada de 2025, queremos criar um espaço para que os membros da comunidade Instruct Korea no Discord compartilhem tendências e notícias de pesquisa e façam networking. O tema desta meetup é "Minhas ideias e desafios ao pesquisar modelos de linguagem". Esperamos ouvir as experiências de outras pessoas, compartilhar nossas próprias ideias de pesquisa e promover a troca entre pessoas com opiniões diferentes.

O evento acontecerá em 25 de janeiro de 2025 (sábado), das 14h às 18h.

O local é o Nons, perto da estação Gangnam (Yeoksam-dong 624-17).

Contato: https://instruct.kr

Patrocínio do local: Nons Community (https://nonce.community/)

Apresentações Mais palestrantes serão anunciados em breve.

Go Seok-hyeon (Sionic AI) Contará sobre seu trabalho com NLP usando a linguagem Scala JVM. Em especial, compartilha a experiência de portar e colocar em produção código de deep learning baseado em Python para linguagens JVM.

Ji-su Kim (kuotient, Allganize): Desenvolvimento do modelo em coreano do Qwen2.5 "Desenvolvimento do modelo em coreano do Qwen2.5" compartilha o processo inovador de desenvolvimento de um modelo de linguagem. Chama atenção, em particular, o processo que levou a um ganho de desempenho impressionante de 37,60 no m-ArenaHard. Aborda o pipeline de treinamento completo, incluindo SFT, Merging e Alignment, além de apresentar inovações técnicas inéditas no país, como troca de camadas e adoção de estratégia on-policy. Detalhará como alcançou o melhor desempenho entre modelos abaixo de 8B.

Seung-yu Lee (dopeornope, Marker AI): LLM Guidance e Quantization Sob o tema "LLM Guidance e Quantization", destaca as tendências mais recentes da tecnologia de LLM em rápida evolução. Traz uma análise perspicaz sobre os conceitos e a direção de evolução das técnicas de LLM Guidance e quantization, atualmente muito estudadas.

Yong-sang Yoo: Retrospectiva da competição de linguagem financeira da KRX Em "Retrospectiva da competição de linguagem financeira da KRX", compartilha dicas práticas de campo para o desenvolvimento de modelos especializados por domínio. Aborda estratégias de domain adaptation e continual pretraining para melhorar o desempenho no benchmark MCQA, além de tratar a fundo de safety auditing.

Sun-woong Choi: História do projeto de desenvolvimento de RAG Compartilha a experiência real de um projeto de desenvolvimento de RAG. Em particular, apontará de forma franca os problemas encontrados durante a execução e apresentará as lições aprendidas e as direções de melhoria com base nisso.

Young-jun Jang (yjoonjang): Modelo de embedding em coreano Com o tema "Modelo de embedding em coreano", envolvendo o huggingface.co/nlpai-lab, compartilhará as características de diferentes modelos de embedding e os pontos principais no processo de treinamento prático. Da escolha do modelo de embedding até o treinamento, pretende trazer insights prontamente aplicáveis no trabalho.

Se-min Jeong (Sionic AI): Construindo um Recsys com Graph RAG - Storm fooding Com o tema "Construindo um Recsys com Graph RAG - Storm fooding", compartilha experiência no desenvolvimento de um sistema de recomendação com base em sistemas RAG orientados a grafo. Cobrindo todo o processo, desde o design do sistema até a implementação.

Dong-kyu Kim (Jeffrey Kim, AutoRAG): Conseguir 3 mil estrelas no GitHub No tema "Conseguir 3 mil estrelas no GitHub", conta a história de crescimento do projeto open source AutoRAG, desde o início até a abertura bem-sucedida para open source, e compartilha a direção de evolução daqui para frente.

maywell (instruct.kr, Wanot AI) TBD

Ainda não há comentários.

Ainda não há comentários.