- Busca entender o mercado de trabalho atual e as tendências por meio das threads "Ask HN: Who Is Hiring" do Hacker News
- Usou Selenium para pesquisar no Google todo mês por "ask hn who is hiring {month} {year}" e coletar os IDs das threads
- Usou a HN-API para coletar os IDs dos comentários de nível superior e armazená-los em um banco de dados sqlite3
- Usou GPT-4o para classificar os comentários
- Usou o método
llm.batch(array) do LangChain para processar em paralelo e tratar os dados rapidamente
Resultados
Quantas vagas permitem trabalho remoto?
- Durante a pandemia, apenas um quinto das vagas não oferecia suporte a trabalho remoto
- A proporção de vagas que oferecem trabalho remoto não caiu tanto quanto o esperado
Quantas vagas patrocinam visto?
- A proporção de vagas com patrocínio de visto permaneceu relativamente estável nos últimos 2 anos
- Ainda é difícil encontrar vagas com patrocínio de visto
Como muda a distribuição por nível de experiência?
- Nos próximos 6 a 12 meses, será importante acumular mais de 8 anos de experiência
Quantidade de vagas por estado nos EUA
- A Bay Area e NYC oferecem muito mais vagas do que outras regiões
Quais bancos de dados são usados?
- PostgreSQL é usado de forma esmagadora em comparação com outros bancos de dados
Quais frameworks JavaScript estão em alta demanda?
- A demanda por React é muito alta
- Foi criado um gráfico de bolhas interativo com
three.js, sem usar escala logarítmica
Como é a distribuição salarial?
- Não foram fornecidos detalhes específicos sobre a distribuição salarial
Lições aprendidas
- É preciso descrever os campos do modelo da forma mais precisa possível
- Ao classificar, é preciso explicitar as classes na descrição
- Ao extrair conjuntos, é preciso especificar os delimitadores na descrição
Trabalho futuro
- Com base neste trabalho inicial, parece possível criar um mini SaaS que classifique e faça correspondências mensais a partir da descrição da vaga que o usuário procura nas threads "Ask HN: Who is hiring?"
Opinião do GN⁺
- Este texto mostra bem como analisar o mercado de trabalho usando ciência de dados e técnicas de processamento de linguagem natural
- O processamento paralelo com GPT-4o e LangChain é útil para tratar grandes volumes de dados rapidamente
- Reflete a realidade de que ainda é difícil encontrar vagas com patrocínio de visto, o que pode ser útil para quem busca esse tipo de informação
- A alta demanda por React e PostgreSQL é uma boa referência para quem quer aprender essas tecnologias
- A ideia do mini SaaS pode ajudar muito candidatos a emprego se for realmente implementada
1 comentários
Opinião no Hacker News
A análise com GPT-4o é interessante
É uma pena não conseguir encontrar o código-fonte do projeto no GitHub
Obrigado por investir tempo e dinheiro no projeto
É uma ótima combinação de LLM com análise tradicional
Empilhar barras no gráfico não é uma boa ideia
É preciso usar escala logarítmica para o gráfico não parecer estranho
Seria interessante fazer a mesma análise com Claude 3 Haiku
Seria interessante comparar com uma amostra aleatória do Indeed ou do LinkedIn
No gráfico de frameworks JS, existem bolhas tanto para "React Native" quanto para "React-Native"
Gostaria de ver uma análise semelhante de "Who Wants to be Hired"