📄️ Introdução
Na visão, é utilizada a YOLOv8, uma arquitetura de rede neural convolucional para detecção de objetos em tempo real. Para entender mais da bilbioteca é recomendado o vídeo a seguir:
📄️ Gravando as imagens
Para obter as imagens para o treinamento, primeiro gravamos vídeos utilizando a câmera que futuramente será usada no projeto. Para isso, conectamos a câmera em um USB e executamos o seguinte script:
📄️ Dividir os vídeos em frames
Agora, os vídeos serão divididos em frames. Para isso, executamos o seguinte script:
📄️ Árvore de Arquivos
Nesta seção conseguimos vemos a estrutura dos pacotes da visão
📄️ Separar os frames
Para o treinamento com Tiny YOLOv4, é necessário separar as imagens em 3 categorias2val
📄️ Marcando labels
Agora, os frames estão separados de acordo com sua função e devem ser marcados para o treinamento. Para isso, será utilizado o LabelImg.
📄️ Criando arquivos auxiliares
Durante o processo de treinamento, optamos por utilizar o Google Colab como nossa plataforma principal, aproveitando sua potente infraestrutura em nuvem, e utilizamos o Google Drive para organizar e armazenar nosso conjunto de dados, simplificando o gerenciamento e promovendo a colaboração eficiente.
📄️ Trechos de código a serem alterados para treinar
Aqui será descrito o que deve ser alterado no arquivo