Abstract
Trong thời gian gần đây, lĩnh vực nghiên cứu về Trí tuệ Nhân tạo (AI) đã đạt được những tiến bộ đáng kể. Có nhiều ứng dụng thực tế đã xuất hiện nhờ vào những thành tựu mới, như: công nghệ nhận dạng, xe tự lái, dịch thuật,... và đặc biệt là sự bùng nổ của các Chatbot sử dụng mô hình ngôn ngữ lớn. Các tập đoàn và viện nghiên cứu hàng đầu trên thế giới đang chạy đua phát triển các mô hình AI có khả năng tương tác chính xác theo yêu cầu. Tuy nhiên, mặc dù đã đạt được một số thành tựu nhưng đến nay, các mô hình AI vẫn chưa đạt được sự thông minh tương đương với bộ não con người. Dựa trên các nghiên cứu và thực nghiệm, chúng tôi đề xuất một phương pháp có khả năng thích ứng, giúp mô hình liên tục học trong quá trình vận hành. Mô hình này sẽ lựa chọn và lưu trữ tri thức từ những trải nghiệm thu thập trước đó, nhằm phục vụ cho các nhiệm vụ theo yêu cầu. Giải pháp đề xuất gồm 4 bước: (1) Khởi tạo mô hình nhận dạng ban đầu; (2) Xác định và thu nhận dữ liệu từ các trường hợp khác nhau của đối tượng trong quá trình theo vết; (3) Tìm kiếm, lựa chọn các mô hình, các siêu tham số (hyperparameters) tối ưu trên tập dữ liệu vừa tìm được; (4) Huấn luyện và cập nhật lại mô hình. Kết quả của nghiên cứu đề xuất có thể là một hướng phát triển mới của một mô hình học thích ứng trong nhận dạng đối tượng nâng cao.
Publisher
Ho Chi Minh City University of Technology and Education
Reference33 articles.
1. J. Achiam et al., "Gpt-4 technical report," arXiv preprint arXiv:2303.08774. 2023.
2. H. Bertrand et al., "Hyperparameter optimization of deep neural networks: Combining hyperband with Bayesian model selection," in Conférence sur l’Apprentissage Automatique, 2017, Art no. 10497518.
3. K. Blix and T. Eltoft, "Machine learning automatic model selection algorithm for oceanic chlorophyll-a content retrieval," Remote Sensing, vol. 10, p. 775, 2018.
4. E. Bochinski et al., "Hyper-parameter optimization for convolutional neural network committees based on evolutionary algorithms," in 2017 IEEE international conference on image processing (ICIP), 2017, pp. 3924-3928.
5. C. Y. Wang, I. H. Yeh, and H. Y. M. Liao, "YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information," arXiv:2402.13616v2, 2024.