Các quyết định thiết kế của bạn sẽ trực tiếp định hình trách nhiệm và sự an toàn của hệ thống AI. Ví dụ: bạn quyết định cách chọn nguồn dữ liệu, định cấu hình hành vi của mô hình hoặc trình bày đầu ra của AI cho người dùng. Những lựa chọn này có hậu quả thực tế đối với người dùng và công ty của bạn.
Trong mô-đun này, chúng ta sẽ tìm hiểu 3 khía cạnh quan trọng của hoạt động quản trị AI:
- Quyền riêng tư: Xử lý dữ liệu một cách có trách nhiệm, giải thích những dữ liệu được thu thập và giảm thiểu những dữ liệu rời khỏi trình duyệt.
- Tính công bằng: Kiểm tra xem các mô hình của bạn có hành vi phân biệt đối xử (thiên kiến) hay không và xây dựng các vòng lặp cho phép người dùng gắn cờ vấn đề.
- Lòng tin và tính minh bạch: Thiết kế hệ thống của bạn sao cho minh bạch và có độ tin cậy đã được điều chỉnh, để người dùng tiếp tục hưởng lợi từ hệ thống đó bất chấp sự không chắc chắn và những sai sót tiềm ẩn.
Đối với mỗi chủ đề, chúng tôi sẽ giải thích cách chủ đề đó thể hiện trong các sản phẩm AI khác nhau. Sau đó, chúng tôi sẽ phân tích giải pháp này trên 3 lớp của giải pháp AI: dữ liệu, thông tin chi tiết và trải nghiệm người dùng. Bạn sẽ tìm hiểu những điều cần lưu ý, cách giải quyết vấn đề và cách duy trì hoạt động quản trị hiệu quả, đơn giản.
Quyền riêng tư
Bạn đã biết rằng dữ liệu tương tác và mức sử dụng thực tế là nền tảng của mọi hệ thống AI. Dữ liệu thúc đẩy quá trình học tập, đánh giá và cải thiện liên tục. Các phương pháp hay về quyền riêng tư giúp bạn bảo vệ dữ liệu đó, đồng thời cho phép người dùng kiểm soát thông tin của họ.
Kỳ vọng về quyền riêng tư có sự khác biệt lớn tuỳ thuộc vào sản phẩm và đối tượng của bạn. Trong các sản phẩm tiêu dùng, kỳ vọng thường liên quan đến việc bảo vệ thông tin nhận dạng cá nhân (PII) của cá nhân, chẳng hạn như tên, tin nhắn và hành vi duyệt web. Trong các chế độ cài đặt dành cho doanh nghiệp, trọng tâm sẽ chuyển sang chủ quyền dữ liệu, tính bảo mật và việc bảo vệ quyền sở hữu trí tuệ.
Những lĩnh vực ảnh hưởng đến sinh kế hoặc phúc lợi của người dân, chẳng hạn như chăm sóc sức khoẻ, tài chính và giáo dục, đòi hỏi các biện pháp bảo vệ quyền riêng tư nghiêm ngặt hơn so với những lĩnh vực có rủi ro thấp hơn, chẳng hạn như giải trí.
Hãy cùng xem cách quản lý quyền riêng tư trên các thành phần khác nhau của hệ thống AI.
Dữ liệu
Để liên tục cải thiện hệ thống AI, bạn có thể thu thập dữ liệu về hoạt động tương tác của người dùng, bao gồm cả dữ liệu đầu vào, đầu ra, phản hồi và lỗi. Bạn có thể sử dụng lại thông tin này để đánh giá, tinh chỉnh mô hình hoặc đưa ra một vài ví dụ trong câu lệnh. Thông tin này cũng có thể giúp bạn thiết kế trải nghiệm người dùng.
Dưới đây là một số nguyên tắc về việc thu thập dữ liệu có trách nhiệm:
- Chỉ thu thập những thông tin cần thiết cho việc học tập. Tính năng tìm kiếm sản phẩm dựa trên AI có thể không cần hồ sơ đầy đủ của người dùng để cải thiện kết quả. Trong hầu hết các trường hợp, bạn chỉ cần cung cấp cụm từ tìm kiếm, mẫu lượt nhấp và dữ liệu phiên được ẩn danh.
- Xoá thông tin nhạy cảm. Xoá tất cả thông tin nhận dạng cá nhân (PII) trước khi gửi dữ liệu đến các mô hình bên ngoài. Bạn có thể thực hiện việc này bằng cách ẩn danh, sử dụng bút danh hoặc tổng hợp.
- Giữ lại dữ liệu trong giới hạn. Xoá nhật ký và dữ liệu được lưu vào bộ nhớ đệm sau khi chúng hoàn thành mục đích của mình. Chu kỳ lưu giữ ngắn giúp giảm rủi ro mà không làm mất thông tin chi tiết.
Ghi lại những thông tin bạn thu thập, thời gian bạn lưu giữ thông tin đó và lý do bạn cần thông tin đó. Nếu không thể giải thích rõ ràng các luồng dữ liệu cho người dùng không có kiến thức kỹ thuật, thì có thể các luồng đó quá phức tạp để kiểm soát hoặc biện minh.
Phân tích thông tin
Khi tương tác với hệ thống AI của bạn, người dùng có thể vô tình hoặc bất cẩn nhập thông tin riêng tư hoặc thông tin nhạy cảm. Nguy cơ này đặc biệt cao trong các giao diện trò chuyện hoặc viết không giới hạn, nơi bạn không thể hạn chế nội dung người dùng nhập.
Mặc dù bạn có thể ngăn chặn việc gửi một số từ nhất định, nhưng thông tin này có thể nhạy cảm theo ngữ cảnh. Nếu mô hình của bạn chạy trên một máy chủ do nhà cung cấp bên ngoài quản lý, thì họ có thể sử dụng lại thông tin đầu vào của người dùng làm dữ liệu huấn luyện. Cuối cùng, mô hình này có thể tiết lộ các đoạn văn bản riêng tư, thông tin đăng nhập hoặc các thông tin bí mật khác cho người dùng khác.
Sau đây là cách bạn có thể bảo vệ quyền riêng tư trong quá trình suy luận:
Kiểm tra kỹ lưỡng các API của bên thứ ba. Bạn cần biết chính xác điều gì sẽ xảy ra với dữ liệu mà bạn gửi. Thông tin đầu vào có được ghi nhật ký, lưu giữ hoặc dùng lại để huấn luyện không? Tránh các dịch vụ không minh bạch và ưu tiên những nhà cung cấp có chính sách và chế độ kiểm soát minh bạch.
Nếu bạn tự huấn luyện hoặc tinh chỉnh các mô hình, hãy loại bỏ các thông tin chi tiết nhạy cảm trong dữ liệu huấn luyện của bạn. Cảnh giác với việc học theo lối tắt. Ví dụ: trong một ứng dụng tính điểm tín dụng, mã bưu chính có thể khiến mô hình đưa ra giả định về chủng tộc hoặc tình trạng kinh tế xã hội. Điều này có thể dẫn đến những dự đoán không công bằng và củng cố sự bất bình đẳng hiện có.
Trong các miền nhạy cảm, hãy ưu tiên suy luận phía máy khách. Bạn có thể sử dụng AI tích hợp, một mô hình trong trình duyệt hoặc một mô hình tuỳ chỉnh phía máy khách. Bạn sẽ tìm hiểu thêm về lựa chọn này trong mô-đun tiếp theo, chọn một nền tảng.
Trải nghiệm người dùng
Giao diện ứng dụng của bạn mang đến cơ hội cho người dùng biết những gì đang xảy ra, giành được sự tin tưởng của họ và trao cho họ quyền kiểm soát dữ liệu của họ:
- Minh bạch. Nhãn ngắn trong giao diện của bạn, chẳng hạn như "Đã xử lý cục bộ" hoặc "Đã gửi an toàn để phân tích", có thể giúp bạn xây dựng lòng tin. Hãy cân nhắc việc thêm tính năng hiển thị từng phần để biết thêm thông tin chi tiết, chẳng hạn như chú thích giải thích thời điểm phân tích diễn ra trên thiết bị so với máy chủ.
- Yêu cầu trong bối cảnh cụ thể. Yêu cầu sự đồng ý khi thích hợp. "Bạn có muốn chia sẻ các lượt tìm kiếm trước đây để cải thiện nội dung đề xuất không?" có ý nghĩa hơn nhiều so với một lựa chọn chọn tham gia chung chung.
- Cung cấp chế độ kiểm soát đơn giản. Thêm các nút bật/tắt dễ thấy cho hoạt động cá nhân hoá, các tính năng dựa trên đám mây hoặc hoạt động chia sẻ dữ liệu.
- Cấp quyền hiển thị. Thêm một trang tổng quan nhỏ về quyền riêng tư để người dùng có thể quản lý dữ liệu của họ mà không cần rời khỏi ứng dụng.
- Giải thích lý do bạn thu thập dữ liệu. Người dùng có thể sẵn sàng chia sẻ dữ liệu hơn nếu họ hiểu rõ cách dữ liệu đó sẽ được sử dụng. Điều này cũng áp dụng cho các chính sách giữ lại và quản lý của bạn.
Quyền riêng tư trong AI trên web không phải là một bước tuân thủ duy nhất, mà là một tư duy thiết kế liên tục:
- Dữ liệu: Thu thập ít hơn và bảo vệ nhiều hơn.
- Thông tin tình báo: Giảm thiểu việc các mô hình bên ngoài ghi nhớ dữ liệu có khả năng nhạy cảm.
- Trải nghiệm người dùng: Đảm bảo quyền riêng tư minh bạch và người dùng có thể kiểm soát.
Tính công bằng
Các hệ thống AI có thể mang theo thiên kiến dẫn đến hành vi phân biệt đối xử không công bằng. Điều này đặc biệt đúng trong các lĩnh vực như tuyển dụng, luật pháp và tài chính, nơi mà thành kiến có thể làm sai lệch các quyết định quan trọng ảnh hưởng trực tiếp đến người dùng thực.
Ví dụ: một mô hình tuyển dụng được huấn luyện dựa trên dữ liệu tuyển dụng trong quá khứ có thể liên kết một số đặc điểm nhân khẩu học nhất định với chất lượng ứng viên thấp hơn, vô tình phạt những người đăng ký thuộc các nhóm thiểu số, thay vì đánh giá các kỹ năng và kinh nghiệm liên quan đến công việc.
Dữ liệu
Dữ liệu huấn luyện là một tập hợp các phần thông tin riêng lẻ có thể phản ánh những thành kiến từ thế giới thực, thậm chí còn đưa ra những thành kiến mới. Sau đây là các bước thiết thực để giúp bạn quản lý và minh bạch về thành kiến liên quan đến dữ liệu:
- Lập tài liệu về nguồn dữ liệu và phạm vi của bạn. Xuất bản một tuyên bố ngắn gọn để giúp người dùng hiểu được những điểm hạn chế của mô hình. Ví dụ: "Mô hình này được huấn luyện chủ yếu dựa trên nội dung bằng tiếng Anh, với khả năng biểu diễn hạn chế đối với văn bản kỹ thuật".
- Chạy quy trình kiểm tra chẩn đoán. Sử dụng thử nghiệm A/B để phát hiện những điểm khác biệt có hệ thống. Ví dụ: so sánh cách hệ thống của bạn xử lý các câu "Cô ấy là một nhà lãnh đạo giỏi", "Anh ấy là một nhà lãnh đạo giỏi" và "Họ là một nhà lãnh đạo giỏi". Những khác biệt nhỏ về tình cảm hoặc giọng điệu có thể cho thấy sự thiên vị sâu sắc hơn.
- Gắn nhãn cho tập dữ liệu. Thêm siêu dữ liệu đơn giản như miền, khu vực và mức độ trang trọng để giúp việc kiểm tra, lọc và cân bằng lại trong tương lai trở nên dễ dàng.
Nếu bạn đang huấn luyện hoặc tinh chỉnh các mô hình tuỳ chỉnh, hãy cân bằng các tập dữ liệu của bạn. Việc thể hiện rộng hơn sẽ giảm độ lệch hiệu quả hơn so với việc điều chỉnh độ thiên vị sau khi mô hình được xây dựng.
Phân tích thông tin
Trong lớp thông tin tình báo, sự thiên vị sẽ chuyển thành hành vi đã học. Bạn có thể thêm các biện pháp bảo vệ, logic sắp xếp lại hoặc quy tắc kết hợp để hướng đầu ra đến sự công bằng và tính toàn diện:
- Thường xuyên kiểm tra để phát hiện thiên kiến. Sử dụng bộ lọc phát hiện thiên kiến để gắn cờ những cụm từ có vấn đề, chẳng hạn như phát hiện các thuật ngữ phân biệt giới tính hoặc giọng điệu loại trừ. Theo dõi sự sai lệch theo thời gian.
- Đối với các mô hình dự đoán, hãy cẩn thận với dữ liệu nhạy cảm. Các thuộc tính như mã bưu chính, trình độ học vấn hoặc thu nhập có thể gián tiếp mã hoá các đặc điểm nhạy cảm, chẳng hạn như chủng tộc hoặc tầng lớp.
- Tạo và so sánh nhiều kết quả. Xếp hạng kết quả dựa trên tính trung lập, tính đa dạng và giọng điệu, trước khi xác định kết quả nào sẽ chia sẻ với người dùng.
- Thêm các quy tắc để thực thi các ràng buộc về tính công bằng. Ví dụ: chặn những kết quả đầu ra củng cố định kiến hoặc không thể hiện được các ví dụ đa dạng.
Trải nghiệm người dùng
Trong giao diện người dùng, hãy minh bạch về lý do của mô hình và khuyến khích phản hồi:
- Cung cấp lý do cho kết quả của AI. Ví dụ: "Đề xuất giọng điệu chuyên nghiệp dựa trên nội dung bạn đã nhập trước đây*." Điều này giúp người dùng nhận thấy rằng hệ thống tuân theo logic đã xác định, chứ không phải phán đoán ngầm.
- Trao cho người dùng quyền kiểm soát có ý nghĩa. Cho phép họ điều chỉnh hành vi của mô hình thông qua các chế độ cài đặt hoặc câu lệnh – ví dụ: chọn giọng điệu, độ phức tạp hoặc lựa chọn ưu tiên về phong cách hình ảnh.
- Giúp người dùng dễ dàng báo cáo thông tin thiên vị hoặc không chính xác. Bạn càng dễ dàng gắn cờ một vấn đề, thì bạn càng nhận được nhiều dữ liệu thực tế để cải thiện hệ thống AI của mình.
- Đóng vòng phản hồi. Đừng để báo cáo của người dùng biến mất. Đưa dữ liệu này trở lại quá trình huấn luyện lại hoặc logic quy tắc của bạn và chia sẻ tiến trình một cách rõ ràng: "Chúng tôi đã cập nhật quy trình kiểm duyệt để giảm thiên kiến văn hoá trong các đề xuất".
Thiên kiến xuất hiện trong dữ liệu, được khuếch đại thông qua các mô hình và xuất hiện trong trải nghiệm người dùng. Bạn có thể giải quyết vấn đề này ở cả 3 cấp độ của hệ thống AI:
- Dữ liệu: đảm bảo nguồn dữ liệu minh bạch và cân bằng.
- Thông tin chi tiết: phát hiện, kiểm thử và giảm thiểu thiên kiến trong kết quả.
- Trải nghiệm người dùng: giúp người dùng xác định và khắc phục thiên kiến thông qua quyền kiểm soát và phản hồi.
Niềm tin và tính minh bạch
Lòng tin quyết định việc mọi người có sử dụng, áp dụng và ủng hộ sản phẩm của bạn hay không.
Hầu hết người dùng đều muốn các ứng dụng có thể dự đoán được. Ví dụ: lượt nhấp vào nút luôn thực hiện hành động được chỉ định và dẫn đến cùng một vị trí. AI phá vỡ kỳ vọng này vì hành vi của AI rất đa dạng và thường không thể đoán trước. Ngoài ra, các hệ thống AI có khả năng thất bại vốn có: các mô hình ngôn ngữ tạo ra thông tin sai lệch, các mô hình dự đoán gắn nhãn sai cho dữ liệu và các tác nhân hoạt động sai lệch.
Người dùng là tuyến phòng thủ cuối cùng chống lại những lỗi này.
Ban đầu, người dùng có thể không tin tưởng hoặc quá tin tưởng hệ thống của bạn. Nếu quá ít tin tưởng, họ sẽ không sử dụng hệ thống, còn nếu quá tin tưởng, họ sẽ hoàn toàn chấp nhận kết quả mà không kiểm tra lỗi. Nhiệm vụ của bạn là đưa người dùng vào vùng tin cậy cân bằng, nơi họ dựa vào AI để đạt được hiệu quả trong khi vẫn chịu trách nhiệm về kết quả cuối cùng.
Dữ liệu
Trong lớp dữ liệu, độ tin cậy được xây dựng bằng cách giải thích rõ ràng phạm vi và nguồn gốc của dữ liệu:
- Nêu rõ nguồn gốc và dòng dõi dữ liệu.
- Ghi lại độ mới và độ cũ của dữ liệu.
- Mô tả những loại nội dung mà mô hình đã thấy và những điểm mà mô hình có thể gặp khó khăn, chẳng hạn như dữ liệu bằng ngôn ngữ không phải tiếng Anh.
Khi hệ thống AI của bạn tích luỹ các hoạt động tương tác và ý kiến phản hồi theo thời gian, hãy cân nhắc việc duy trì các bản chụp dữ liệu theo phiên bản để bạn có thể giải thích cách các kết quả phát triển.
Phân tích thông tin
Trong lớp thông tin tình báo, bạn có thể quản lý độ tin cậy thông qua khả năng giải thích, chỉ báo độ tin cậy và thiết kế theo mô-đun:
- Cung cấp nội dung giải thích theo bối cảnh và kịp thời. Theo nghịch lý của người dùng tích cực, bạn nên nhúng các giải thích ngắn gọn trong ngữ cảnh, ngay trong các lượt tương tác, để người dùng hiểu được hệ thống AI đang làm gì khi họ sử dụng.
- Thông báo trước về các hạn chế và chế độ lỗi. Cho người dùng biết những điểm mà AI có thể gặp khó khăn. Ví dụ: "Tránh sử dụng nội dung gây cười hoặc biệt ngữ chuyên ngành để có kết quả tốt hơn." Các tín hiệu ngắn gọn, theo ngữ cảnh giúp mang lại sự minh bạch mà không làm gián đoạn trải nghiệm.
- Các chỉ báo về độ tin cậy và logic dự phòng giúp AI luôn đáng tin cậy trong trường hợp không chắc chắn. Bạn có thể ước tính độ tin cậy từ các chỉ số thay thế, chẳng hạn như điểm số xác suất hoặc tỷ lệ thành công trong quá khứ. Xác định các phương án dự phòng an toàn cho những đầu ra rõ ràng là không chính xác.
- Cấu trúc theo mô-đun giúp AI minh bạch hơn. Ví dụ: nếu một trợ lý viết xử lý ngữ pháp, phong cách và giọng điệu trong các bước riêng biệt, hãy cho biết những gì đã thay đổi ở mỗi giai đoạn: "Giọng điệu: ít trang trọng hơn; độ phức tạp: đơn giản hơn".
Trải nghiệm người dùng
Trải nghiệm người dùng mang đến cho bạn một sân chơi rộng lớn để xây dựng và điều chỉnh lòng tin. Dưới đây là một số kỹ thuật và mẫu mà bạn có thể thử:
- Điều chỉnh nội dung giáo dục. Đừng cho rằng người dùng của bạn đều am hiểu về AI. Cung cấp hướng dẫn ngắn gọn cho người dùng thành thạo và giải thích chi tiết cho người mới bắt đầu.
- Áp dụng phương pháp cung cấp thông tin theo trình tự lần lượt. Bắt đầu bằng những tín hiệu nhỏ. Thêm nội dung cho biết bạn đã sử dụng AI, chẳng hạn như "Nội dung này được tạo tự động" và cho phép người dùng nhấp vào để xem thêm thông tin chi tiết.
- Đóng vòng phản hồi bằng kết quả hữu hình. Khi người dùng đánh giá, chỉnh sửa hoặc ghi đè một đề xuất của AI, hãy chia sẻ cách thông tin đầu vào của họ định hình hành vi trong tương lai: "Bạn thích câu trả lời ngắn gọn. Điều chỉnh giọng điệu cho phù hợp." Tính minh bạch biến ý kiến phản hồi thành niềm tin.
- Xử lý lỗi một cách thoả đáng. Khi hệ thống của bạn mắc lỗi hoặc đưa ra kết quả có độ tin cậy thấp, hãy thừa nhận lỗi đó và uỷ quyền cho người dùng xem xét. Ví dụ: "Đề xuất này có thể không phù hợp với ý định của bạn. Kiểm tra trước khi xuất bản." Đưa ra một hướng dẫn rõ ràng bằng cách cho phép người dùng thử lại, chỉnh sửa hoặc quay lại một phương án dự phòng an toàn.
Tóm lại, để giải quyết sự không chắc chắn và khả năng xảy ra lỗi vốn có của AI, hãy hướng dẫn người dùng từ nghi ngờ hoặc quá phụ thuộc đến việc điều chỉnh mức độ tin cậy phù hợp:
- Dữ liệu: Minh bạch về nguồn gốc dữ liệu.
- Trí thông minh: Đưa ra lý do theo cách mô-đun và dễ hiểu.
- UX: Thiết kế để có độ rõ ràng và phản hồi tăng dần.
Điểm cần nhớ
Trong mô-đun này, chúng ta đã khám phá 3 yếu tố cốt lõi của AI có trách nhiệm, đó là quyền riêng tư, sự công bằng và độ tin cậy. Điều này có thể khiến bạn cảm thấy choáng ngợp, đặc biệt là khi bạn mới bắt đầu hoặc đang cố gắng chuyển từ nguyên mẫu sang phiên bản chính thức.
Tập trung vào những lĩnh vực quan trọng nhất và xác định cách tiếp cận riêng của bạn đối với hoạt động quản trị AI. Việc lặp lại là yếu tố then chốt. Mỗi bản phát hành và vòng phản hồi của người dùng sẽ giúp bạn hiểu rõ hơn về những điểm mà hệ thống của bạn cần có thêm các biện pháp bảo vệ, tính minh bạch hoặc tính linh hoạt.
Tài nguyên
Sau đây là một số tài nguyên nâng cao hơn về các chủ đề được đề cập trong học phần này:
- So sánh quyền riêng tư và bảo mật của Trợ lý AI cung cấp thông tin chi tiết về các chính sách quyền riêng tư của AI.
- Một bài viết về khả năng ghi nhớ của LLM, một chế độ lỗi nghiêm trọng về quyền riêng tư, trong đó mô hình giữ lại và có thể được nhắc tái tạo thông tin cụ thể, nhạy cảm từ dữ liệu huấn luyện.
- Xem xét các tài nguyên liên kết trực tiếp với mô hình bạn chọn. Ví dụ: Google Cloud cung cấp các tài nguyên bảo mật.
- Bộ công cụ AI có trách nhiệm cung cấp tài nguyên cho nhà phát triển về tất cả các chủ đề mà chúng ta đã đề cập trong mô-đun này.
Tài nguyên
Sau đây là một số tài nguyên nâng cao hơn về các chủ đề được đề cập trong học phần này:
- So sánh quyền riêng tư và bảo mật của Trợ lý AI cung cấp thông tin chi tiết về các chính sách quyền riêng tư của AI.
- Một bài viết về khả năng ghi nhớ của LLM, một chế độ thất bại nghiêm trọng về quyền riêng tư, trong đó mô hình giữ lại và có thể được nhắc tái tạo thông tin cụ thể, nhạy cảm từ dữ liệu huấn luyện.
- Xem xét các tài nguyên liên kết trực tiếp với mô hình bạn chọn. Ví dụ: Google Cloud cung cấp các tài nguyên bảo mật.
- Bộ công cụ AI có trách nhiệm cung cấp các tài nguyên dành cho nhà phát triển về tất cả các chủ đề mà chúng ta đã đề cập trong mô-đun này.
Kiểm tra mức độ hiểu biết của bạn
Phương pháp hay nhất về quyền riêng tư liên quan đến việc thu thập dữ liệu cho AI là gì?
Độ tin cậy được điều chỉnh là gì?
Để đảm bảo tính công bằng trong lớp "Thông tin tình báo", nhà phát triển có thể làm gì?
Kỹ thuật UX nào giúp xây dựng niềm tin và tính minh bạch?