Abstract
Hiện nay, có nhiều thuật toán bắt bám đối tượng đạt hiệu quả khá tốt trên ảnh nhìn thấy (visible hay RGB images) như KCF, CSRDCF, SiamFC, SiamRPN, ATOM, SiamDW_ST, DiMP. Tuy nhiên, các phương pháp này bị giảm chất lượng khi điều kiện chiếu sáng của môi trường bị kém đi. Các thuật toán sử dụng kết hợp ảnh nhìn thấy và ảnh nhiệt (thermal hay TIR images) như FSRPN, SiamDW_T, mfDiMP đã chứng minh hiệu năng bắt bám đối tượng được nâng cao đáng kể so với khi chỉ dùng riêng ảnh nhìn thấy hoặc ảnh nhiệt. Trong bài báo sẽ trình bày kết quả nghiên cứu một thuật toán bắt bám đối tượng sử dụng đa nguồn ảnh với trọng số xác định theo điều kiện môi trường. Kết quả thử nghiệm trên bộ dữ liệu VOT-RGBT cho thấy thuật toán này có chỉ số EAO đạt 0,423, cao hơn so với một số thuật toán bắt bám đối tượng phổ biến hiện nay và đạt tốc độ khoảng 13 khung hình/giây trong điều kiện phần cứng phổ dụng.
Publisher
Academy of Military Science and Technology