6 thách thức trong gán nhãn hình ảnh (Image Annotation)
Công việc gán nhãn hình ảnh hiện nay ngày càng trở nên phổ biến, đặc biệt là gán nhãn keypoint và segmentation, tỉ lệ thuận với “cơn khát” dataset trong lĩnh vực AI và Machine Learning. Công việc này không hề đòi hỏi cao về chuyên môn cũng như kinh nghiệm nên thu hút nhiều sinh viên làm thêm và những người làm tại nhà toàn thời gian. Tuy nhiên, bên cạnh những lợi ích hấp dẫn về thu nhập, thời gian làm việc, địa điểm làm việc, công việc này cũng có những khó khăn có thể làm chùn bước nhiều người ngay ở những nhiệm vụ đầu tiên.
1. Gán nhãn hình ảnh là gì?
Các thuật toán trong AI và Machine Learning chỉ có thể được áp dụng, vận hành sau khi các kỹ sư cung cấp cho chúng các tệp dữ liệu được đánh dấu thông tin (theo các quy ước cụ thể), hay còn gọi là được gán nhãn.
Tuỳ vào từng bài toán hoặc yêu cầu, các tệp dữ liệu này sẽ được gán nhãn theo các kỹ thuật và phương pháp khác nhau.
Hiểu rõ vai trò của các tệp dữ liệu được gán nhãn trong các dự án AI và Machine Learning là điều kiện tiên quyết, giúp những người gán nhãn dễ dàng nắm được “phổ” tiêu chuẩn trong quá trình làm việc, tránh mất thời gian và công sức vô ích, đồng thời, tối ưu hoá việc giao tiếp với PM (Project Manager – Quản lý dự án) cũng như QC (Quality Control – Kiểm soát chất lượng) của dự án.
Bạn hãy tham khảo các bài viết sau để hiểu rõ hơn về các vai trò trên:
Data Annotation là gì?
Các kỹ thuật chú thích hình ảnh
Keypoint Annotation và các ứng dụng trong Machine Learning
Gán nhãn dữ liệu – Nghề mới trong thời đại chuyển đổi số
2. Những khó khăn của công việc gán nhãn dữ liệu hình ảnh
Ngoài việc hiểu rõ chức năng của các tệp dữ liệu đối với từng bài toán AI, trên thực tế, những người gán nhãn dữ liệu cũng cần có một số kỹ năng mềm rất riêng biệt. Mục tiêu cho các mô hình AI là làm được hoặc tư duy được, các tác vụ giống với cách mà con người làm. Vậy nên, để các tệp dữ liệu có thể dùng được cho việc “huấn luyện” mô hình AI, những người gán nhãn cho chúng cũng cần có tư duy và kiến thức thực tế rất đáng kể. Bằng không, họ sẽ phải đối mặt với những khó khăn nhất định khi tham gia vào thị trường lao động rất đặc thù này.
Tệp dữ liệu phức tạp
Mỗi đối tượng đều có những đặc điểm riêng biệt và đa dạng. Điều này đòi hỏi sự hiểu biết thực tế về cấu trúc của đối tượng tương đối tốt và khả năng nhận diện đối tượng hoặc bộ phận của đối tượng trong nhiều tình huống hoặc góc ảnh khác nhau. Ví dụ: Mặt người già (da chảy xệ) sẽ khó gán nhãn ở miệng, mắt, lông mày hơn người trẻ (da căng),…
Ảnh: Pixtastock
Khó khăn trong xác định đúng vị trí
Đôi khi, việc xác định vị trí chính xác của các điểm chính có thể gặp khó khăn, đặc biệt đối với những phần bị che khuất do góc quay hoặc góc chụp. Nhiều dự án chỉ có bộ dữ liệu hình ảnh với phần lớn hoặc toàn bộ là người mẫu đeo kính râm hoặc khẩu trang.
Ảnh: Pixtastock
Nhiễu trong ảnh hoặc video
Một số dữ liệu ảnh hoặc video có thể chứa nhiễu như độ phân giải thấp, ánh sáng không đồng đều, nhiễu màu hoặc các loại nhiễu khác. Những yếu tố này có thể làm cản trở việc gán nhãn các điểm chính trên khuôn mặt (facial keypoint annotation), làm cho kết quả gán nhãn không được chuẩn xác như kỳ vọng, hoặc như mục tiêu ban đầu của dự án. Với trường hợp này, những kiến thức về cấu tạo cơ thể người và kinh nghiệm thực tế mới là chìa khoá để tăng độ chính xác của kết quả gán nhãn.
Ảnh: Pixtastock
Công việc đòi hỏi kỷ luật, sự tập trung và tính nhất quán cao
Bản thân gán nhãn dữ liệu nói chung đã luôn là công việc yêu cầu sự tập trung và tỉ mỉ nhất định. Đối với các tập dữ liệu lớn hoặc phức tạp, việc gán nhãn có thể trở thành công việc tốn nhiều thời gian và công sức, dễ làm nản chí những người có khả năng tập trung kém và ít kiên nhẫn. Do đặc thù phục vụ các bài toán theo dõi thay đổi giữa các đối tượng có cấu trúc giống nhau, các nhiệm vụ này có thể trở nên rất nhàm chán, đòi hỏi người gán nhãn phải có kỷ luật tốt và nhất quán trong tiêu chuẩn gán nhãn. Có lẽ đây là lý do chính mà nhiều người gán nhãn quyết định từ bỏ công việc.
Khả năng đọc hiểu tài liệu tốt và làm việc độc lập
Hầu hết các dịch vụ Data Annotation hiện nay không cung cấp training 1:1 cho cộng tác viên hoặc nhân viên bán thời gian làm việc từ xa. Các bạn sẽ cần tự đọc guideline và gán như chỉ tương tác với PM và QC của dự án qua Q&A.
Rất khó để làm việc thuận lợi nếu như các bạn cảm thấy guideline gán nhãn dữ liệu quá phức tạp và không biết cách đặt câu hỏi cho PM hoặc QC.
Thích ứng nhanh với các công cụ gán nhãn và tin học văn phòng
Các công cụ gán nhãn phổ biến hiện nay như OpenCV, CVAT, dlib, LabelImg, Amazon Mechanical Turk,… đều có giao diện và quy trình gán nhãn khác nhau. Vậy nên, một nhân viên gán nhãn chuyên nghiệp sẽ cần có khả năng tin học văn phòng tốt, khả năng học hỏi và thích ứng nhanh với bất kỳ công cụ nào được cung cấp. Có thể dễ dàng thấy rằng, thực tế, có một nhóm đối tượng thực sự rất khó để phù hợp với công việc này kể cả họ chăm chỉ và có nhiều thời gian rảnh: những người “low tech”. Rất nhiều dự án có deadline gấp, PM hoặc QC thường điều phối nhiệm vụ ở các dự án này cho những nhân viên gán nhãn nhạy bén và gần như không gặp khó khăn với công cụ.
Ảnh: Pixtastock
3. Đâu là cách để giúp bản thân phù hợp với công việc gán nhãn dữ liệu hơn?
Tiêu chuẩn gán nhãn ở các dự án có thể rất khác nhau. Ngoài tính cách nhạy bén, kỷ luật cao, và một số kỹ năng mềm, một nhân viên gán nhãn dữ liệu cũng cần có sự chủ động nhất định với những tác vụ sau:
- Đọc kỹ các yêu cầu và nắm rõ mục tiêu của dự án. Chủ động nắm vững những ví dụ, quy tắc và tiêu chí xác định các điểm chính mà PM hoặc QC của dự án đã cung cấp.
- Tiếp nhận đào tạo một cách nghiêm túc và cập nhật feedback liên tục. Cập nhật các feedback là tác vụ quan trọng để giảm thiểu lỗi sai và nâng cao chất lượng gán nhãn qua mỗi nhiệm vụ trong dự án.
- Giao tiếp là một chiếc chìa khóa vàng để quy trình gán nhãn trở nên trơn tru hơn. Ví dụ: Trao đổi với PM hoặc QC dự án để hiểu rõ hơn về giới hạn chấp nhận khi phỏng đoán vị trí các keypoint trong các dữ liệu phức tạp. Hoặc với các trường hợp dữ liệu hình ảnh có điều kiện ánh sáng kém, đối tượng cần gán nhãn bị mờ,… Q&A luôn rất cần thiết với các dự án có tuyển dụng nhiều nhân viên gán nhãn làm việc từ xa.
Ảnh: Pixtastock
Tổng quan, công việc gán nhãn hình ảnh vốn không kén đối tượng thực hiện và kinh nghiệm làm việc, nhưng lại đòi hỏi một số tố chất nhất định. Điều quan trọng nhất là nên có những kỹ năng phù hợp để đảm bảo KPI cho dự án.
Hy vọng bài viết này là một nguồn tham khảo phù hợp, giúp các bạn đang có ý định trở thành nhân viên gán nhãn dữ liệu hiểu hơn về công việc đặc thù này, cũng như nắm rõ mức độ phù hợp của bản thân với nó.
Tham khảo công việc gán nhãn dữ liệu tại PIXTA Vietnam tại ĐÂY.
Tác giả: Cao Minh Ngọc