Semana 03 - Acelerando Entregas e Estruturando Bases

Semana de avanços importantes: site quase finalizado, estrutura do GitHub definida e primeira análise robusta de dados concluída.

A terceira semana do Small Data Lab marcou um ponto de virada.

A sensação é clara:
aquilo que, até então, era uma construção interna, começa — de fato — a ganhar forma pública.

A decisão de abandonar o Jekyll e migrar a estrutura do site para a Hostinger se mostrou absolutamente acertada.

Em dois dias, consegui estruturar toda a base do site.

Isso me permitiu acelerar etapas,
Focar no que realmente importa
E evitar ficar preso em detalhes técnicos que, neste momento, não agregariam tanto valor.

Paralelamente, avancei na organização do GitHub, que passa a ser a espinha dorsal da parte técnica do SDL — o espaço onde ficam os repositórios dos projetos, códigos, notebooks e documentações.

A definição dos pilares do SDL ficou bem estabelecida nesta etapa:

  • GitHub → estrutura técnica.

  • LinkedIn → posicionamento profissional e networking.

  • Site → espaço público de desenvolvimento profissional — organizado e acessível.

O site, que nasceu como um portfólio técnico, começa a assumir um papel mais amplo.
Além de apresentar competências analíticas, estratégicas e de comunicação, ele também se torna um espaço de referência para quem está em transição de carreira.

Se ele puder, de alguma forma, contribuir com isso, melhor ainda.

Na frente dos dados, a semana foi igualmente intensa.

Realizei todo o processo de:

  • Limpeza,

  • Padronização,

  • Curadoria,

  • E classificação das vagas.

Uma decisão importante foi segmentar as empresas por setores e subsetores, o que deixou a análise muito mais contextualizada e precisa.

Também implementei uma política de anonimização, criando codinomes para as empresas e preservando suas identidades — alinhado ao caráter investigativo e ético do projeto.

Com o dataset tratado e convertido para DuckDB, a análise começou de fato.

E, como já era esperado, surgiram várias incoerências:
Vagas declaradas como nível de entrada (assistente e júnior)
Pedindo stacks técnicas, experiências e responsabilidades que, na prática, estão muito acima do que esse nível deveria exigir.

Uma constatação preocupante — mas, infelizmente, nada surpreendente.

Aprofundei também a análise das hard skills mais demandadas em cada setor e como isso se conecta (ou não) com os níveis de senioridade declarados.

E ficou claro algo que, talvez, seja a essência do trabalho com dados:

Esse é um processo que gera mais perguntas do que respostas.
E tudo bem. Porque é assim que se constrói entendimento real.

O fechamento da semana trouxe duas decisões estratégicas:

A primeira:
O site será lançado no início da próxima semana, junto de uma atualização completa no LinkedIn, comunicando publicamente a transição da engenharia para a ciência de dados.

A segunda:
Começo os estudos de Machine Learning, etapa fundamental para o avanço do projeto Code Against Fraud, e inicio também o desenvolvimento da V2 do Job Data Insight, com o objetivo de aprimorar a eficiência dos agentes e explorar alternativas éticas para automatizar a coleta das vagas — que, por enquanto, segue sendo manual.

⬅️ Semana 02 | Semana 03 (você está aqui)