Đội quân dán nhãn và tham vọng AI của Trung Quốc

 Saturday, 01/12/2018

Đội quân dán nhãn và tham vọng AI của Trung Quốc

Đội quân dán nhãn Trung Quốc Thay vì diễn ra trong những tòa cao ốc tại thành phố lớn như Thâm Quyến hay Bắc Kinh, một số công việc quan […]

Đội quân dán nhãn Trung Quốc

Thay vì diễn ra trong những tòa cao ốc tại thành phố lớn như Thâm Quyến hay Bắc Kinh, một số công việc quan trọng trong quá trình thúc đẩy và hoàn thành các mục tiêu công nghệ của Trung Quốc lại diễn ra trong một nhà máy xi măng cũ ở tỉnh Hà Bắc. Nơi đó, giữa sân vẫn còn một máy trộn bê tông không hoạt động. Còn ở nhà kho bên cạnh, các hộp đồ ăn nhanh được xếp từng chồng.

Bên trong, Hou Xiameng đang điều hành một công ty về trí tuệ nhân tạo (AI) có tên Yunzhi. Nhân viên là khoảng hai chục người trẻ tuổi, liên tục xem ảnh và video, sau đó ghi nhãn về tất cả mọi thứ họ nhìn thấy. Đó có thể là một chiếc xe hơi, đèn giao thông, bánh mì, sữa hay sôcôla, đôi khi là những thứ trông giống như một người đang di chuyển.

“Tôi từng nghĩ rằng máy móc là thiên tài”, cô Hou, 24 tuổi, nói. “Bây giờ tôi biết chúng tôi chính là lý do cho sự thiên tài của chúng”.

Bên ngoài công ty xử lý dữ liệu Yunzhi ở thành phố Nangongshi của Hou

Bên ngoài công ty xử lý dữ liệu Yunzhi ở thành phố Nangongshi của Hou Xiameng.

Ở Trung Quốc, quốc gia được mệnh danh là công xưởng của thế giới, một thế hệ những người lao động mới với thu nhập thấp đang lắp ráp nền móng của tương lai. Một loạt công ty khởi nghiệp ở các thành phố nhỏ nổi lên để phụ trách việc xử lý hình ảnh từ hệ thống camera giám sát khổng lồ của chính phủ. Nếu coi Trung Quốc là “Ả-Rập Xê-Út về dữ liệu”, các doanh nghiệp này như những nhà máy lọc dầu, biến dữ liệu thô thành nhiên liệu để cung cấp năng lượng cho tham vọng AI của chính phủ.

Nhìn từ bên ngoài, Trung Quốc và Mỹ đang cạnh tranh cho ngôi vị dẫn đầu về trí tuệ nhân tạo. Quốc gia châu Á có những lợi thế nhất định. Với sự hỗ trợ của chính phủ, số lượng các công ty khởi nghiệp về công nghệ ở Trung Quốc chiếm 1/3 toàn cầu trong năm 2017, vượt qua Mỹ.

Nhờ thói quen và chính sách lỏng lẻo về quyền riêng tư, các công ty Internet Trung Quốc có thể thu thập dữ liệu nhiều hơn cả Facebook, Google hay Amazon bởi người dân tại đây sử dụng điện thoại di động vào mọi việc từ mua sắm, trả tiền ăn cho tới đặt vé xem phim. Chính quyền nước này tin sẽ đứng số một về trí tuệ nhân tạo vào năm 2030.

Tuy nhiên, dữ liệu có lớn và đầy đủ tới đâu cũng sẽ vô dụng nếu không được phân tích và thống kê. Đó là lý do cho sự tồn tại của những công ty như của Hou Xiameng. Các nhãn dữ liệu được gắn là khởi nguồn sức mạnh của cả một ngành công nghiệp trí tuệ nhân tạo đang phát triển.

Bên trong văn phòng làm việc của công ty Yunzhi.

Bên trong văn phòng làm việc của Yunzhi.

“Chúng tôi là công nhân xây dựng trong thế giới số”, Yi Yake, đồng sáng lập của một công ty ghi nhãn dữ liệu ở huyện Giáp, tỉnh Hà Nam, cho biết. “Công việc của chúng tôi là xếp từng viên gạch một. Không có chúng tôi xếp gạch, họ không thể xây dựng những tòa nhà chọc trời”.

Dù AI là hệ thống có khả năng học hỏi và giỏi trong những tính toán phức tạp, chúng lại có khả năng nhận thức không bằng một đứa trẻ 5 tuổi. Trẻ nhỏ biết một con chihuahua hay một con béc-giê khổng lồ đều là chó. Chúng có thể không phân biệt được xe bán tải của Ford với xe “con bọ” Volkswagen Beetle, nhưng hiểu cả hai đều là xe hơi.

AI phải được dạy để biết điều đó. Nó phải phân tích một lượng lớn ảnh và video được gắn nhãn trước khi nhận ra một con mèo đen và một con mèo trắng là hai con mèo. Đây là công việc hàng ngày của công nhân tại các nhà máy xử lý dữ liệu. Họ còn được gọi là tagger (người gắn nhãn thẻ).

AInnovation, một công ty về AI ở Bắc Kinh, áp dụng công nghệ của mình vào hệ thống thu ngân tự động cho một chuỗi cửa hàng bánh. Người dùng có thể đặt bánh ngọt của họ dưới máy quét và thanh toán mà không cần sự trợ giúp của con người. Nhưng gần một phần ba thời gian, hệ thống gặp khó khăn khi phân biệt bánh nướng xốp với bánh rán và bánh thịt heo, do ảnh hưởng từ ánh sáng trong cửa hàng và chuyển động của con người. Với công việc này, các tagger có thể hoàn thành với độ chính xác 99%, theo Liang Rui, quản lý của AInnovation.

“Tất cả trí thông minh nhân tạo được xây dựng trên sức lao động của con người”, Liang nói.

AInnovation có chưa đầy 30 tagger. Có lần, Liang cần dán nhãn cho khoảng 20.000 bức ảnh trong một siêu thị trong ba ngày. Họ phải thuê một xưởng xử lý dữ liệu bên ngoài và đơn vị này đã hoàn thành nó với chi phí chỉ vài nghìn USD.

Công nhân tại trụ sở của công ty Ruijin ở Jiaxian, tỉnh Hà Nam, Trung Quốc.

Công nhân tại trụ sở của công ty Ruijin ở huyện Giáp, tỉnh Hà Nam.

“Chúng tôi như những dây chuyền lắp ráp cách đây 10 năm”, Yi Yake, đồng sáng lập nhà máy xử lý dữ liệu ở Hà Nam, cho biết.

Các nhà máy như thế đang xuất hiện nhiều ở các khu vực hẻo lánh, nơi giá cả lao động và chi phí thuê văn phòng rẻ. Nhiều công nhân tại đây từng làm việc trong các dây chuyền lắp ráp hay xây dựng ở những thành phố lớn. Tuy nhiên, việc ít và thu nhập thấp khiến họ chuyển nghề. Nhiều người cũng muốn tìm việc ở gần nhà thay vì đi xa.

Yi năm nay 36 tuổi, từng thất nghiệp. Trong thời gian khó khăn đó, ông đã nhận ra tiềm năng của lĩnh vực dán nhãn dữ liệu và Hà Nam là nơi hội đủ tiêu chuẩn về nhân công và chi phí để bắt đầu cho một công ty khởi nghiệp. Tháng 3/2018, ông và bạn bè thành lập Ruijin Technology. Công ty thuê văn phòng trong một khu công nghiệp với giá 21.000 USD một năm. Hiện công ty sử dụng 300 công nhân nhưng dự định mở rộng lên 1.000 người sau kỳ nghỉ Tết Nguyên đán sắp tới, khi nhiều người đi làm xa trở về nhà. Không giống các doanh nghiệp lớn khác, ông không lo lắng công ty sẽ thiếu việc làm.

“Các cỗ máy không đủ thông minh để tự dạy chính mình”, ông nói.

Vấn đề của ông là việc thuê người. Ông trả lương công nhân từ 400-500 USD mỗi tháng, cao hơn mức trung bình ở địa phương. Nhưng nhiều người vẫn lo lắng khi tuyển dụng bởi họ bởi không biết gì về AI, số khác thì thấy công việc nhàm chán.

Jin Weixiang, 19 tuổi, cho biết sẽ bỏ việc ở Ruijin sau Tết để đi bán hàng. “Tôi là một người hướng ngoại và có khả năng giao tiếp”, Jin nói. “Giờ tôi chỉ đang ghi nhãn để kiếm tiền”.

Nhưng đối với nhiều người khác, việc này vẫn tốt hơn so với làm trên các dây chuyền lắp ráp. “Công việc trước đây khá nhàm chán, ngày qua ngày lặp đi lặp lại”, Yi Zhenzhen, 28 tuổi, từng làm tại một công ty linh kiện điện tử cho biết. “Bây giờ tôi phải sử dụng bộ não của mình một chút”.

Đa số các trường hợp, khách hàng không nói cho nhà máy xử lý dữ liệu biết ý nghĩa đơn hàng là gì.

Một số khá dễ hiểu như ghi nhãn cho đèn giao thông, biển báo và người đi bộ, vì chúng thường để hỗ trợ hệ thống xe tự lái.

Ghi nhãn nhiều loại hoa khác nhau có thể dùng cho công cụ tìm kiếm. Nhưng có khi Ruijin được giao nhiệm vụ ghi nhãn hình ảnh của hàng triệu miệng người. Yi nói ông không chắc nó là gì, đoán nó có thể liên quan tới nhận diện khuôn mặt.

Hou Xiameng, từng làm việc cho một công ty AI ở Bắc Kinh, nay về Hà Bắc để xây dựng công ty xử lý dữ liệu của riêng mình.

Hou Xiameng, từng làm việc cho một công ty AI ở Bắc Kinh, nay về Hà Bắc để xây dựng công ty xử lý dữ liệu của riêng mình.

Khoảng gần 500 km về phía bắc của tỉnh Hà Bắc, Hou Xiameng rời khỏi nhà máy để về nhà mẹ chồng. Sau khi tốt nghiệp, cô sống và làm việc ở Bắc Kinh, cho một công ty nổi tiếng về AI và nhận diện khuôn mặt. Nhưng cuộc sống tại thủ đô quá khó khăn và tốn kém. Cô và chồng chưa cưới, Zhao Yacheng, quyết định chuyển về quê và xây dựng nhà máy xử lý dữ liệu. Cha mẹ cô hỗ trợ tiền mua máy tính và bàn làm việc. Hou đang cải tạo nhà kho bên cạnh để có thể thuê thêm 80 người nữa.

Giống như Yi, Hou không dành thời gian suy nghĩ về những tác động của công việc của mình. Cô không quan tâm rằng nó có giúp tạo nên một hệ thống kiểm soát con người ra sao và các tác động, hệ lụy có liên quan.

“Camera khiến tôi cảm thấy an toàn”, cô nói. “Bây giờ chúng ta đang kiểm soát máy móc”.

Nguồn: vnexpress

Comments


Image

Hỏi tư vấn viên