
Semana 03 - Acelerando Entregas e Estruturando Bases
Semana de avanços importantes: site quase finalizado, estrutura do GitHub definida e primeira análise robusta de dados concluída.
A terceira semana do Small Data Lab marcou um ponto de virada.
A sensação é clara:
aquilo que, até então, era uma construção interna, começa — de fato — a ganhar forma pública.
A decisão de abandonar o Jekyll e migrar a estrutura do site para a Hostinger se mostrou absolutamente acertada.
Em dois dias, consegui estruturar toda a base do site.
→ Isso me permitiu acelerar etapas,
→ Focar no que realmente importa
→ E evitar ficar preso em detalhes técnicos que, neste momento, não agregariam tanto valor.
Paralelamente, avancei na organização do GitHub, que passa a ser a espinha dorsal da parte técnica do SDL — o espaço onde ficam os repositórios dos projetos, códigos, notebooks e documentações.
A definição dos pilares do SDL ficou bem estabelecida nesta etapa:
GitHub → estrutura técnica.
LinkedIn → posicionamento profissional e networking.
Site → espaço público de desenvolvimento profissional — organizado e acessível.
O site, que nasceu como um portfólio técnico, começa a assumir um papel mais amplo.
Além de apresentar competências analíticas, estratégicas e de comunicação, ele também se torna um espaço de referência para quem está em transição de carreira.
→ Se ele puder, de alguma forma, contribuir com isso, melhor ainda.
Na frente dos dados, a semana foi igualmente intensa.
Realizei todo o processo de:
Limpeza,
Padronização,
Curadoria,
E classificação das vagas.
Uma decisão importante foi segmentar as empresas por setores e subsetores, o que deixou a análise muito mais contextualizada e precisa.
Também implementei uma política de anonimização, criando codinomes para as empresas e preservando suas identidades — alinhado ao caráter investigativo e ético do projeto.
Com o dataset tratado e convertido para DuckDB, a análise começou de fato.
E, como já era esperado, surgiram várias incoerências:
→ Vagas declaradas como nível de entrada (assistente e júnior)
→ Pedindo stacks técnicas, experiências e responsabilidades que, na prática, estão muito acima do que esse nível deveria exigir.
Uma constatação preocupante — mas, infelizmente, nada surpreendente.
Aprofundei também a análise das hard skills mais demandadas em cada setor e como isso se conecta (ou não) com os níveis de senioridade declarados.
E ficou claro algo que, talvez, seja a essência do trabalho com dados:
→ Esse é um processo que gera mais perguntas do que respostas.
→ E tudo bem. Porque é assim que se constrói entendimento real.
O fechamento da semana trouxe duas decisões estratégicas:
→ A primeira:
O site será lançado no início da próxima semana, junto de uma atualização completa no LinkedIn, comunicando publicamente a transição da engenharia para a ciência de dados.
→ A segunda:
Começo os estudos de Machine Learning, etapa fundamental para o avanço do projeto Code Against Fraud, e inicio também o desenvolvimento da V2 do Job Data Insight, com o objetivo de aprimorar a eficiência dos agentes e explorar alternativas éticas para automatizar a coleta das vagas — que, por enquanto, segue sendo manual.
⬅️ Semana 02 | Semana 03 (você está aqui)
Small Data Lab
Ciência de Dados em Movimento
© 2025 Small Data Lab - Todos os direitos reservados
Contato: contato@smalldatalab.com.br