11 ideias de projetos de aprendizado de máquina para iniciantes
O aprendizado de máquina é amplo e aplicável em muitos campos. Portanto, você pode se perder tentando encontrar um ponto de apoio como um iniciante. No entanto, assumir projetos enquanto aprende ajuda a decifrar seus interesses e focar em um caminho específico.
Além disso, permite que você se familiarize com o fluxo de trabalho típico de aprendizado de máquina.
Aqui, mostraremos algumas das melhores ideias de projetos para iniciantes que o ajudarão a se aprofundar nos detalhes do aprendizado de máquina.
1. Previsão de Empréstimo
Muitos aplicativos de empréstimos e bancos agora incorporam modelos de elegibilidade de empréstimos. Portanto, este é um ângulo inspirador para começar, se você estiver interessado em aplicar o aprendizado de máquina ao seu conhecimento atual de fintech.
No entanto, não é provável que você amplie isso para incorporação de aplicativos. Mas você aprenderá como a maioria dos aplicativos empresariais decidem se alguém é elegível para um empréstimo ou não.
Para começar, você precisa de um conjunto de dados contendo algumas informações financeiras. Aproveitando as tendências de ganhos e gastos nesses dados, você treinará seu modelo para aprender padrões específicos e prever a elegibilidade para empréstimos quando receber novas informações.
2. Análise de sentimento
Brincar com a análise de sentimento é uma ideia perfeita, especialmente se você tem um talento especial para palavras escritas.
Se você está confuso, a análise de sentimento envolve classificação de texto ou agrupamento por uma máquina, geralmente em percepções positivas e negativas.
Como acontece com muitos projetos de linguagem natural, a seleção de recursos pode ser um pouco desafiadora aqui também. Mas a análise de sentimentos no texto geralmente começa com a mineração de texto para estudar os padrões dos textos em questão. Isso permite que você descubra os principais recursos em seu conjunto de dados que podem ser usados como critérios de treinamento.
Você pode então usar algoritmos de classificação apropriados como o Naive Bayes ou a árvore de decisão para treinar seu modelo. Em última análise, este projeto expõe os conceitos básicos de manipulação de texto e como funciona a detecção de spam.
Python oferece uma tonelada de algoritmos flexíveis e lógica em torno da análise de sentimento. Portanto, se você está familiarizado com o Python, que é relativamente fácil de entender, pode dar uma olhada em como usar o kit de ferramentas de processamento de linguagem natural .
3. Codifique um modelo de regressão logística
A regressão logística é um modelo de classificação simples, perfeito para iniciantes. Como você já deve saber, ele encontra a probabilidade de ocorrência de eventos discretos.
Você pode começar trabalhando com conjuntos de dados contendo valores discretos como "Sim" e "Não" ou "Bom" e "Ruim". Como outros algoritmos de classificação, a regressão logística ajuda sua máquina a codificá-los em valores legíveis para que possa prever de forma adequada.
E se você quiser prever mais de dois resultados possíveis, você pode se aprofundar mais na regressão logística multinomial. Dito isso, o scikit-learn do Python pode ser uma ferramenta muito útil para escrever seu modelo.
4. Reconhecimento de imagem
Tecnologias como reconhecimento facial e detecção de imagens falsas podem parecer mágica. Mas quando você se envolver em um projeto de reconhecimento de imagem DIY, você logo perceberá que criar um é mais fácil do que você poderia imaginar.
Além disso, você tem um grande número de bibliotecas de aprendizado de máquina de processamento de imagens à sua disposição. O TensorFlow , por exemplo, oferece recursos versáteis para modelagem de imagens.
E se o TensorFlow for complexo para restringir, Keras , uma parte da plataforma TensorFlow, também é uma ferramenta valiosa que você pode aproveitar. Em última análise, uma compreensão básica de Redes Neurais Artificiais (RNA) é útil para este projeto.
Seu projeto de reconhecimento de imagem, no entanto, pode variar de detecção de imagem falsa a algoritmos de reconhecimento de imagem.
Embora pareça entediante no início, torna-se mais fácil à medida que você se aprofunda. Além disso, oferece uma compreensão sólida dos conceitos de aprendizado profundo.
5. Classificação e previsão do câncer
A classificação do câncer é um ângulo interessante a ser examinado, especialmente se você estiver interessado em aplicar seu conhecimento de aprendizado de máquina em áreas médicas como a bioinformática.
Seus dados normalmente contêm métricas padrão para decidir se um tumor é benigno ou maligno. Em seguida, você usará essas informações para criar um modelo que classifica novos casos de câncer na categoria apropriada usando as mesmas métricas. Dependendo de como você pretende abordar isso, você pode usar um algoritmo de classificação como a árvore de decisão para informar a decisão da máquina.
E se você quiser aumentar o conhecimento existente, pode até mesmo levar seu projeto mais fundo, investigando a previsão do câncer. Aqui, você pode usar algoritmos como Support Vector Machines (SVMs) e Artificial Neural Networks (ANN) para atingir seu objetivo.
6. Previsão do preço das ações (agrupamento)
O mercado de ações é volátil e os preços são baseados em uma infinidade de fatores diferentes. Portanto, determinar uma ação lucrativa às vezes pode ser uma batalha difícil para os investidores.
Como você está resolvendo um problema financeiro e, ao mesmo tempo, aprendendo os conceitos básicos do aprendizado de máquina, este projeto vale seu tempo.
Seu conjunto de dados deve conter várias informações de estoque e como elas mudaram ao longo do tempo. Por serem padrões de aprendizado mais eficientes, seu modelo usará essas informações para prever se uma ação vai cair ou subir em um determinado momento. Portanto, isso também está relacionado a uma análise de série temporal, pois seu modelo prevê resultados futuros.
E felizmente, muitas ferramentas também estão à sua disposição para este projeto. O Profeta do Facebook , por exemplo, é uma ferramenta de previsão de código aberto. Você pode usar isso com Python. Mas se você está mais confortável com R, o Prophet também suporta R de forma massiva.
7. Previsão de nicho de site
Este não é um projeto muito popular para iniciantes. Mas você pode enfrentar se gosta de desafios e deseja descobrir as ferramentas que pode usar para atingir seu objetivo.
Um dos contratempos que você pode encontrar com este projeto é onde obter conjuntos de dados. Mas depois de descobrir as informações de que precisa para resolver o problema, você pode copiar os dados usando este tutorial do BeautifulSoup .
Para fazer isso funcionar, você precisa considerar métricas como os cabeçalhos de uma página da web. Além disso, procure frases e palavras-chave usadas com frequência, pois elas são, pelo menos, indicações sobre o que é uma página da web. Portanto, isso significa que você deve selecionar seus recursos cuidadosamente para uma precisão razoável.
8. Construir um sistema de recomendação usando Python
Você deve ter encontrado um sistema de recomendação ao navegar na internet ou usar aplicativos como YouTube e Netflix. A maioria dos sistemas de publicidade na Internet também o usa para filtrar os anúncios que você vê – e, às vezes, parece que a Internet sabe o que você está pensando.
Em alguns casos, com base no que você pesquisa com frequência na Internet, um recomendador pode aprender sobre suas preferências de conteúdo. Em seguida, ele usa isso para recomendar conteúdo relacionado que pode ser do seu interesse.
O seu pode não ser tão complexo. Mas você pode construir algo bem básico para começar. Um recomendador de produto, por exemplo, é um excelente ponto de partida.
Para construir um recomendador de produto, por exemplo, você precisa reunir dados sobre produtos e as percepções das pessoas sobre eles. Isso, é claro, pode incluir o número de avaliações positivas e negativas, o nicho do produto, o número de compras e muito mais.
9. Previsão da Qualidade do Vinho
A previsão da qualidade do vinho é um dos poucos projetos centrados no iniciante. Este é um problema de classificação que envolve a categorização do vinho em tipos de alta e baixa qualidade.
Para isso, você pode usar algoritmos de classificação como regressão logística ou uma árvore de decisão para treinar seu modelo. Você pode até usar uma RNA se estiver mais interessado em conectar cada ponto para a tomada de decisão.
Como qualquer outro projeto de aprendizado de máquina, este apresenta os principais conceitos de seleção de recursos, correlação, codificação de rótulo e muito mais. Além disso, oferece um playground nivelado com seus dados.
10. Construir um algoritmo de aprendizado de máquina simples
Embora, até este ponto, recomendamos projetos que usam outros algoritmos, você pode codificar um algoritmo DIY do zero usando linguagens amigáveis de ML, como C, C ++, R ou Python.
Embora isso possa parecer um pouco mais desafiador do que as outras tarefas na lista, é uma ideia de projeto perfeita, especialmente se você quiser saber como algoritmos integrados funcionam e iteram por meio de seus dados.
Claro, isso não precisa ser um algoritmo complexo. Você pode pesquisar o conceito matemático por trás de uma regressão linear simples, por exemplo, e usá-lo para criar um algoritmo aplicável, reutilizável e instalável.
11. Detecção de notícias falsas
Não é novidade que notícias falsas e autênticas circulam pela web. Mas ambos têm indicadores e atributos exclusivos que os colocam em qualquer uma das categorias.
Como você está lidando com textos simples, encontrar um padrão descritivo único para os dois tipos de notícias pode ajudá-lo a atingir seu objetivo. Você deve selecionar seu recurso com cuidado para evitar overfitting ou underfitting em seu modelo.
Para este, você pode começar examinando a documentação do Natural Language Toolkit , que possui muitos recursos que você pode usar para processamento de texto.
Aprenda fazendo e torne-se um especialista em aprendizado de máquina
Quer você seja autodidata, esteja fazendo cursos ou aprendendo na escola, pode perder o controle dos conceitos básicos se não aplicar o que está aprendendo.
Embora o aprendizado de máquina pareça complexo, com projetos pessoais, você entenderá mais sobre o ciclo de vida de projetos da vida real e os desafios envolvidos. Assim, manobrar seu caminho quando você encontrar problemas do mundo real se torna mais fácil.