Deskripsi: Fine-Grained Classification


Fine-Grained Classification merupakan salah satu topik pada bidang visi komputer (Computer Vision) dengan tujuan pengenalan (klasifikasi) benda detil (fine-grained). Sebagai contoh, fine-grained car classification adalah penelitian dengan tujuan melakukan pengenalan merk mobil, seperti BMW i320 versi 2010, dll. Selain mobil, ada beberapa fine-grained dataset yang tersedia secara publik untuk digunakan dalam penelitian, diantaranya adalah dataset keanekaragaman burung, keanekaragaram kupu-kupu, tipe pesawat terbang, keanekaragaman bunga, dll.


Berikut merupakan dataset untuk fine-grained classification yang tersedia secara publik dan dapat digunakan untuk penelitian

  • Stanford Car Dataset 
    Website: http://ai.stanford.edu/~jkrause/cars/car_dataset.html
    Deskripsi:
    Pengenalan mobil dengan total 16185 citra dan 196 merk mobil berbeda. Dataset dibagi menjadi data pelatihan (8144 citra) dan data uji (8041 citra). Di dalam dataset juga disediakan anotasi bounding box untuk setiap citra. Setiap satu citra hanya terdiri dari satu bounding box.
  • Caltech-UCSD Birds 200
    Website: http://www.vision.caltech.edu/visipedia/CUB-200.html
    Deskripsi:
    Pengenalan variasi spesies burung dengan total 6033 citra dan 200 variasi spesies burung sebagai kategori. Dataset ini banyak digunakan untuk menganalisa performa dari suatu klasifier dan akurasi paling tinggi masih dibawah 90%.
  • Stanford Dogs Dataset
    Website: http://vision.stanford.edu/aditya86/ImageNetDogs/
    Deskripsi:
    Pengenalan variasi spesies dari anjing dengan total 20580 citra dan 120 variasi spesies dari anjing. Di dalam dataset juga disediakan anotasi bounding box untuk setiap citra. Setiap satu citra hanya terdiri dari satu bounding box.
  • FGVC-AircraftWebsite: http://www.robots.ox.ac.uk/~vgg/data/fgvc-aircraft/
    Deskripsi:
    Pengenalan tipe pesawat terbang (tipe = pembuat + jenis) yang terdiri dari 10200 citra dengan 102 tipe pesawat.
Semua dataset berafiliasi dengan ImageNet dataset (ImageNet dataset akan dijelaskan dipostingan yang lain), yang merupakan dataset yang paling banyak digunakan untuk menganalisa performa dari suatu klasifier serta banyak digunakan sebagai permulaan dari suatu penelitian. Selain itu, ImageNet juga banyak digunakan sebagai media fine tuning (inisialisasi bobot dari klasifier diambil dari klasifier yang telah dilatih dengan menggunakan ImageNet) sehingga jika fine-tuning digunakan maka hasil yang didapatkan boleh jadi tidak realible karena ada kemungkinan citra yang ada di dalam data uji terdapat di dalam data pelatihan ImageNet.



Komentar

Postingan populer dari blog ini

Pengacakan List / Array

Caffe Deep Learning Framework