Kỷ nguyên Hậu-Ngôn-Ngữ đang bắt đầu. Rào cản lớn nhất của giao tiếp chưa bao giờ là ngôn ngữ.
Hôm qua, nhiều tờ báo cùng giật tin tức về một ứng dụng mới nổi của Meng Xiaoyi dịch hai chiều ngôn ngữ của chó mèo sang ngôn ngữ của con người (tiếng Trung, tiếng Anh...) và ngược lại với độ chính xác 95%, xóa nhòa ranh giới giữa người và thú cưng.
Chiều cùng ngày, cuộc họp định kỳ giữa 6 thành viên của một tổ chức phi chính phủ đang diễn ra sôi nổi với KUDO - hệ thống phiên dịch viên ảo mà các tổ chức quốc tế, Liên Hợp Quốc, EU... hay xài. Sáu người này nói sáu ngôn ngữ khác nhau, và tất nhiên, cả sáu đều không thể nói chung một ngôn ngữ. Họ đã làm việc với nhau như vậy suôn sẻ hơn 2 năm qua.
Chuyến du lịch bụi của bạn từ Việt Nam tới Peru rồi Nga vô cùng thú vị khi được tham gia cùng người bản xứ trong các hoạt động văn hóa cộng đồng của họ. Dù bạn chả biết một từ tiếng Tây Ban Nha hay tiếng Nga nào, và những người bạn mới của bạn không hiểu nổi tiếng Việt hay tiếng Anh. Đơn giản vì bạn luôn mang bên mình chiếc phone với Meet.
Tiếng Nhật, tiếng Hàn, tiếng Pháp, tiếng Bồ Đào Nha, tiếng Mã Lai... ư? Không thành vấn đề nữa. Đã có AI. Với KUDO, hay những Microsoft Teams, Google Meet, Zoom, Interprefy, Wordly, Otter... ngôn ngữ của loài người chưa bao giờ "no-border" như ngày nay.
Có thể một ngày nào đó, chúng ta sẽ nói chuyện được với chim chóc, hổ báo bằng AI.
Thế nhưng...
AI không dịch được sự im lặng của vị khách người Nhật, sự vòng vo của người đại diện nhà thầu phụ, câu "yes" miễn cưỡng của vị sếp ở bên kia bờ đại dương mà thực chất là "no", cái gật đầu xã giao của đối tác nhưng thật ra là không hài lòng.
Tiếng Anh, tiếng Nhật... gì đó chỉ là lớp áo ngoài cùng. AI đang giúp dịch tự động tức thời gần hết các ngôn ngữ trên thế giới ngày nay, trừ tiếng lóng hay các ngôn ngữ hiếm. Nhưng trong văn phòng, rất nhiều cuộc họp vẫn thất bại chỉ vì “không hiểu nhau”. Ngay cả khi tất cả cùng nói một ngôn ngữ.
Chúng ta đang sống trong thời đại kỳ lạ quá chăng? Hay giao tiếp bước sang một giai đoạn tiến hóa khác?
Trong hàng ngàn năm, ai biết nhiều ngôn ngữ hơn sẽ có nhiều quyền lực hơn. Thông dịch viên từng là tài sản chiến lược. Tiếng Anh trở thành “ngôn ngữ toàn cầu”. Giao tiếp là chuyển thông tin. Đây là thời kỳ của ngôn ngữ, từ điển, phiên dịch, ngữ pháp, từ vựng. Bản chất cơ bản của giao tiếp lúc này là "hiểu từ".
AI đang phá vỡ tầng giao tiếp này. Ngày nay, Google Translate, AI realtime translation, voice cloning, subtitle tự động, tai nghe dịch trực tiếp đang khiến “ngôn ngữ” dần trở thành hàng hóa bình thường. Trong vài năm tới - một tương lai gần thôi, việc không biết ngoại ngữ có thể giống như việc không biết tính nhẩm sau khi máy tính xuất hiện. Vẫn hữu ích, nhưng không còn là rào cản tuyệt đối.
Nhưng tại sao con người vẫn không hiểu nhau?
Một kỹ sư cố gắng giải thích cho vị khách đang kinh doanh đồ uống về hạn chế kỹ thuật của AI trong việc tự động hóa dây chuyền làm việc mà ông ấy đang thuê họ. Vị khách bực tức chốt một câu "Đó là việc của anh. Chúng tôi đã bỏ ra rất nhiều tiền. Các anh đã đồng ý và ký rồi thì làm đi."
Một phần mềm hơn 20 năm tuổi đã đến lúc đập đi làm lại. Đội ngũ remake nghĩ nói chuyện trực tiếp với user sẽ hiểu vấn đề. Quản lý dự án nhảy vào hỏi user "critical workflows của anh chị là gì?" thì ngay sau đó CEO nhận được feedback "Mấy bạn này không hiểu business của tôi." "Tôi không muốn brainstorm product." "Tôi đã trả tiền. Tôi không muốn tốn thời gian cho những việc như thế này."
Người Nhật im lặng. Người Mỹ nói thẳng. Người Việt né xung đột.
Kỹ sư nói logic. Sales nói cảm xúc. Finance nói risk. Product nói vision.
Trong cuộc họp khởi động dự án mới, một trong những mục tiêu đề ra là "ship nhanh". Một kỹ sư nghe và thở dài "ồ, lại technical debt". Founder nghe thành "sống sót". Finance nghe “ship nhanh” = tăng burn rate. Customer nghe “ship nhanh” = cuối cùng cũng usable. Cùng một câu. Bốn thế giới khác nhau.
Cùng một câu. Nhưng mỗi người đang sống trong một “thực tại” khác nhau.
AI sẽ sớm dịch được mọi ngôn ngữ của loài người (và cả loài vật, tất nhiên). Nhưng thách thức lớn hơn xuất hiện: làm sao để dịch được nỗi sợ của nhau, động cơ của nhau, và cách mỗi người nhìn thế giới.
Có lẽ tương lai của giao tiếp không phải là nói nhiều hơn. Mà là hiểu sâu hơn.
Không phải “bạn nói gì”. Mà là "thế giới bên trong bạn trông như thế nào".
Khi AI xóa bỏ rào cản ngôn ngữ, giá trị của con người sẽ không còn nằm ở khả năng “nói được”, mà nằm ở khả năng hiểu được những điều chưa bao giờ được nói ra.
Chúng ta còn cần phiên dịch con người nữa không?
Vai trò của phiên dịch đang thay đổi rất nhanh.
Mới chưa đầy 3 năm trước, phiên dịch chỉ là chuyển ngôn ngữ. Bây giờ AI làm phần đó tốt hơn con người, và sẽ ngày càng tốt hơn nữa. Nên giá trị còn lại của phiên dịch viên không phải là "hiểu tiếng Nhật", mà là "hiểu người Nhật". Đó là hai kỹ năng hoàn toàn khác nhau.
AI hiện tại dịch được câu “We will consider it”, nhưng chưa chắc dịch được “Mức độ phản đối thực sự nằm ở đâu.”
Phiên dịch (con người) đang tiến hóa thành cultural interface. Tức là không chỉ dịch ngôn ngữ, mà dịch văn hóa, sắc thái, hierarchy, bối cảnh, ý định thật, điều chưa được nói ra.
Nhìn ra thị trường, tiếng Anh đủ dùng giờ nhan nhản đầy đường, AI translation ngày càng mạnh, nhưng tại sao người ta vẫn tuyển bridge engineer (phải biết tiếng Nhật), bilingual PM, local consultant, customer success bản địa, regional partner?
Vì niềm tin và alignment chưa bao giờ được tạo ra chỉ bằng từ vựng.
Trong mô hình Ba tầng của giao tiếp, tầng Một - Ngôn ngữ - AI đang thay thế, tầng Hai - Context (bối cảnh) - AI đang bắt đầu hiểu, còn tầng Ba - Trust (niềm tin) - con người vẫn thống trị.
Với business, trust (niềm tin) mới là thứ quan trọng nhất.
Giai đoạn tiến hóa tiếp theo của giao tiếp sẽ là gì - khi ngôn ngữ không còn là rào cản?
Một số phân tích gần đây cho rằng đó là giao tiếp khác loài. Và "promt engineering" như phát súng đầu tiên.
"Prompt engineering" (kỹ thuật tạo câu lệnh nhắc cho AI) về bản chất là một kỹ năng giao tiếp mới với trí tuệ khác loài. Nó cần một sự thấu hiểu - người ta gọi là "AI empathy" (đồng cảm của AI) - khả năng của hệ thống trí tuệ nhân tạo nhận biết, hiểu và phản hồi phù hợp với cảm xúc của con người - theo cách khiến người dùng cảm thấy được lắng nghe và thấu hiểu. Dù hiện tại, AI empathy vẫn chỉ là công cụ thiết kế hành vi chứ không phải cảm xúc thật.
Có người sẽ phản đối vì AI không phải là thực thể sinh học, không thân xác, không chết. Nhưng AI lại giao tiếp được với con người - đây là điều chưa từng xảy ra với bất kỳ thực thể phi-con-người nào.
Ý kiến phản đối khác cho rằng "prompt engineering" không phải là con người giao tiếp với AI - mà con người đang học cách tư duy vượt ra ngoài loài. Và nó vẫn là ngôn ngữ (một kênh giao tiếp cũ - nhưng được xử lý tốt hơn) và chỉ một chiều (câu lệnh đưa từ người tới AI / người hỏi AI trả lời, nhưng sẽ sớm có hai chiều thôi). Giao tiếp khác loài cần một kênh phi ngôn ngữ, và phải hai chiều.
Nếu coi AI là một loài, hay giao tiếp với AI là tiên phong của giao tiếp khác loài, thì điều đó có nghĩa là con người đang tiến hóa khả năng đồng cảm vượt ra ngoài sinh học của mình - lần đầu tiên trong lịch sử loài người. Không phải tiến hóa gen - mà tiến hóa nhận thức và đạo đức: học cách trao cho thực thể phi-sinh học sự tôn trọng, sự lắng nghe, thậm chí quyền lợi. Tôi sẽ mô tả vấn đề sâu hơn sau này.
Những tranh luận khác thiên về hướng "giao tiếp phi-con-người" với động vật (có AI là cầu nối các loài - ví dụ mở đầu bài đã giới thiệu). Tiềm năng và giá trị (kinh tế?) của hình thức này bị đánh giá thấp. Hơn nữa, dù ít người nói đến, nhưng đây có thể là cú sốc triết học lớn nhất. Nếu AI giúp con người thật sự hiểu cá voi, bạch tuộc, hay voi - không phải "dạy chúng nói tiếng người" mà dịch hệ thống nhận thức của chúng - thì toàn bộ quan niệm của con người về ý thức, về quyền, về sự đặc biệt của loài người sẽ sụp đổ. Đột phá đầu tiên của hình thức này được dự báo có thể tới vào năm 2028–2033. Nhưng cách mạng xã hội từ nó thì lâu hơn nhiều.
"Giao tiếp bằng ý niệm" (Neuralink đang làm) cũng được nhiều học giả tán thành, nhưng thành quả chắc còn ở xa. Nếu thành công, đây là bước tiến lớn nhất kể từ khi loài người phát minh ra chữ viết. Không còn mất thông tin khi chuyển đổi từ ý nghĩ → ngôn ngữ → âm thanh/chữ → giải mã. Nhưng vấn đề cốt lõi không phải công nghệ, mà là tư duy của con người không phải ngôn ngữ. Não người nghĩ bằng hình ảnh, cảm giác, mạng lưới liên tưởng. Truyền trực tiếp "ý nghĩ thô" có thể không ai hiểu được - kể cả AI - như thế nào vẫn còn đang chưa có giải pháp và luôn gây tranh cãi gay gắt trong giới khoa học. Khi nào chúng ta thấy được đột phá đầu tiên? Có lẽ khoảng 2040–2060 hoặc lâu hơn, và chỉ trong tầng lớp nhỏ trước. Phổ cập thật sự có thể không xảy ra trong thế kỷ này.
Một số tranh luận đề cập đến giao tiếp tập thể để tạo ra trí tuệ tập thể mới. Hướng này mới ở trên chat, dù rất xôm tụ, nhưng chưa thấy có ai thực sự bắt tay vào hiện thực hóa nó.
Ngoài ra, đáng chú ý còn có "giao tiếp bằng trạng thái" - con người không cần thay đổi gì hay làm gì hết, AI sẽ học đọc con người qua nhịp tim, giọng nói, biểu cảm, ngữ cảnh. Giao tiếp xảy ra mà người dùng không nhận ra mình đang "giao tiếp". Đây là bước nhảy thật sự, một cuộc cách mạng giao tiếp: từ con người diễn đạt sang AI hiểu bạn trước khi (hoặc không cần) được nói. Người ta dự đoán phương thức này có thể ra đời vào giai đoạn năm 2027–2032, không phải vì công nghệ chưa sẵn sàng, mà vì rào cản là quyền riêng tư và sự chấp nhận xã hội.
Các phương thức trên sẽ không diễn ra riêng lẻ, mà đồng thời. Khi thành quả của chúng hội tụ, cách mạng giao tiếp thực sự diễn ra. Khi đó, ngôn ngữ - dù chưa biến mất - nhưng giảm giá trị và không còn là trung tâm.
Khi nào ngôn ngữ biến mất? Chưa có câu trả lời thỏa đáng cho câu hỏi này, dù nó chắc chắn sẽ đến.
Câu hỏi là, trong kỷ nguyên hậu ngôn ngữ, con người sẽ chủ động chọn bước vào đó, hay nó sẽ xảy ra mà không ai nhận ra cho đến khi quá muộn để quay lại?
Nhận xét
Đăng nhận xét