Pular para o conteúdo principal

Introdução

Na visão, é utilizada a YOLOv8, uma arquitetura de rede neural convolucional para detecção de objetos em tempo real. Para entender mais da bilbioteca é recomendado o vídeo a seguir: YOLOv8

O tutorial detalhado de como realizar o treinamento de um dataset customizado pode ser encontrado na documentação da Ultralytics, empresa responsável pelo desenvolvimento da YOLOv8.

Entretanto, as outras secções da documentação da Edrom explicam o passo a passo utilizado na equipe para a deteção dos objetos desejados, de forma a manter um padrão e evitar conflitos (Mas vale ressaltar que tudo se baseia na documentação oferecida pela Ultralytics).

O passo a passo do treinamento é:

  1. Gravar as imagens com a câmera utilizada
  2. Dividir os vídeos em imagens (denominadas "frames")
  3. Separar os frames em treinamento, validação e avaliação
  4. Marcar os frames para o treinamento
  5. Organização do dataset
  6. Treinamento em si