Làm thế nào mà mọi bài hát, bộ phim, tin nhắn và cuộc gọi trên thế giới đều có thể biến thành những dãy số 0 và 1?
Đưa ra cách đo lường nội dung và tốc độ thông tin
Luận văn thạc sĩ của Claude Shannon khi mới 21 tuổi, về vấn đề này, được các nhà sử học đánh giá "có lẽ là luận án thạc sĩ quan trọng nhất trong lịch sử kỹ thuật", nhưng Shannon khiêm tốn tới mức thường hạ thấp ý nghĩa của nó. "Chẳng qua lúc bấy giờ không ai khác quen thuộc cả hai lĩnh vực đại số nhị phân Boolean và mạch điện" [1]. Đại số nhị phân hay còn gọi là đại số Boolean (do nhà toán học người Anh George Boole phát minh vào giữa những năm 1800), là hệ thống toán học chỉ sử dụng số 0 và 1, tương ứng với trạng thái đúng/sai, hoặc on/off.
Shannon sinh năm 1916 tại Gaylord, Michigan. Tốt nghiệp Đại học Michigan hai chuyên ngành toán và kỹ thuật điện, năm 1936 Shannon đến làm nghiên cứu sinh tại Viện Công nghệ Massachusetts. Tại đây, sau cuộc thảo luận về các hệ thống điều khiển điện phức tạp với một chuyên gia của Bell Labs, Shannon đã chứng minh trong luận án thạc sỹ của mình rằng đại số nhị phân có thể phân tích chính xác các hệ thống điều khiển điện tử. Chính vì các chuyển mạch điện (trong hệ thống điều khiển) cũng chỉ có hai trạng thái cơ bản là bật/tắt nên Shannon nhận ra chúng có thể được mô tả bằng cùng một ngôn ngữ toán học. Luận án này được coi là nền tảng của thiết kế mạch kỹ thuật số kể cả thiết kế chip bán dẫn sau này.
Năm 1948 Shannon đã công bố một kiệt tác của mình "Một Lý thuyết Toán về Thông tin". Đó được coi là một trong những bài báo vĩ đại nhất trong lịch sử kỹ thuật, và chính là nền tảng khoa học của công nghệ thông tin sau này. Lần đầu tiên ông đã đưa ra cách đo lường nội dung thông tin và tốc độ tối đa mà thông tin có thể được truyền đi. Đóng vai trò trung tâm của lý thuyết là khái niệm ‘bit’ (các số 0 và 1 trong đại số nhị phân). Bit trở thành đơn vị cơ bản của thông tin và chúng có thể đo đếm được. Trước đó, người ta hầu như chưa hề có ý niệm rõ ràng nào về thông tin, coi đó là một khái niệm trừu tượng, không đo đếm được bằng thực nghiệm. Cũng giống như Newton đã mô tả chuyển động của mọi vật thể bằng các phương trình toán học, Shannon đã biến "thông tin", vốn được xem là một khái niệm mơ hồ, thành thứ có thể đo đếm, tính toán và tối ưu hóa.
Claude Shannon, ‘cha đẻ’ của lý thuyết thông tin và tin học. Ảnh: Wikimedia, CC BY 2.0
Trong lịch sử phát triển khoa học và công nghệ của nhân loại, hiếm có người nào có vai trò đăc biệt như Claude Shannon. Ông vừa là người đặt nền tảng cho lĩnh vực khoa học mới, vừa đóng góp trực tiếp cho phát triển các lĩnh vực công nghệ. Viện Kỹ thuật Điện và Điện tử (IEEE) danh tiếng của Mỹ có nhiều bài viết về Shannon, trong đó có bài vinh danh ông "là một trong số các kỹ sư vĩ đại nhất của thế kỷ 20 nhưng là người đóng góp nhiều nhất cho công nghệ của thế kỷ 21" [2].
Công trình này đã gây chấn động không chỉ bởi vì Shannon đã kiến tạo nên một ngành khoa học hoàn toàn mới gần như từ con số không mà còn bởi sự ra đời bất ngờ của nó. Trong suốt nhiều năm trời, ông hầu như chẳng hề hé răng nói với bất kỳ ai về công trình mà ông đã dành trọn gần một thập kỷ để nghiên cứu và hoàn thiện.
Một kết quả bất ngờ vào thời đó từ lý thuyết thông tin của Shannon là bất kể bản chất của thông tin là gì - một bài thơ, một bản nhạc giao hưởng hoặc một bộ phim thì cách tối ưu nhất để truyền đi là số hóa chúng thành các bit ‘0 và 1’ rồi chuyển chúng thành tín hiệu điện từ để truyền đi, thu nhận và xử lý. Lý thuyết này chính là nền tảng của kỹ thuật số hiện đại, trong đó ‘bit’, vốn trước đó không ai biết, trở nên siêu quan trọng và là đơn vị phổ quát của mọi hệ thống thông tin.
Một số người đã đặt tầm quan trọng của công trình này ngang hàng với thuyết tương đối của Einstein, dù bản thân Shannon bác bỏ điều đó. Trong một bức thư giới thiệu trước khi xuất bản vào đầu những năm 1950, ông thậm chí còn yêu cầu một nhà báo loại bỏ bất kỳ so sánh lý thuyết của ông với ý tưởng của Einstein về thuyết tương đối: "Tôi ước gì nó được như thế," ông than thở, "lý thuyết thông tin chắc chắn không sánh được với thuyết tương đối và cơ học lượng tử."
Nếu lý thuyết thông tin là thành tựu duy nhất của Shannon, thì nó đã đủ để đảm bảo vị trí của ông trong ngôi đền khoa học và công nghệ của nhân loại. Nhưng ông đã làm được nhiều hơn thế nữa.
Cũng chính Shannon khi mới 21 tuổi đã chỉ ra trong "luận án thạc sĩ quan trọng nhất lịch sử kỹ thuật" của mình rằng đại số nhị phân với các ‘bit’ 0 và 1 có thể phân tích chính xác toàn bộ hoạt động của các mạch logic. Từ đó, ông đã phát minh ra các cổng logic (logic gates AND, OR, NOT, CNOT...) là các thành phần cơ bản nhất của tất cả các mạch điện kỹ thuật số mà toàn bộ tòa lâu đài khoa học máy tính được xây dựng trên đó. Công trình này cũng chính là nền tảng cơ sở của khoa học máy tính và trở thành bệ phóng cho công nghệ tin học bùng nổ những năm sau đó.
Với nhiều người như cựu chủ tịch của Hiệp hội Lý thuyết Thông tin của IEEE, GS Solomon Golomb thì ảnh hưởng của Shannon với công nghệ thông tin "Giống như nói đến mức độ ảnh hưởng của người phát minh ra bảng chữ cái đối với văn học vậy" [3].
Nhà khoa học khiêm tốn đến mức e thẹn khi phải nói về mình
Sau khi hoàn thành luận án tiến sĩ ở MIT, năm 1940 Shannon đến làm việc một năm tại Viện nghiên cứu Cao cấp ở đại học Princeton. Shannon nhớ lại một lần ông đang trình bày báo cáo thì đột nhiên nhà khoa học huyền thoại Einstein bước vào phòng họp. Einstein nhìn Shannon, thì thầm nói gì đó với một nhà khoa học, và rời đi. Sau bài báo cáo của mình, Shannon vội vã chạy đến chỗ nhà khoa học kia và hỏi xem Einstein đã nói gì về mình. Hóa ra nhà vật lý vĩ đại hỏi "trà để ở đâu", Shannon kể lại và bật cười. Shannon kể lại câu chuyện đó nhiều năm sau với vẻ thích thú, như một minh họa cho tính cách hài hước và không quá coi trọng bản thân của ông.
Claude Shannon (đang viết bảng) trong thời kỳ thế chiến II khi còn làm việc ở Bell Labs. Ảnh: Nokia
Shannon gia nhập Bell Labs vào năm 1941. Trong Thế chiến II, ông là thành viên của một nhóm phát triển các hệ thống mã hóa kỹ thuật số, trong đó có hệ thống mà tổng thống Roosevelt sử dụng cho các cuộc điện đàm xuyên đại dương với thủ tướng Churchill. Shannon đã tóm tắt công việc về thông tin liên lạc bí mật trong một tài liệu dài 114 trang, ‘Một Lý Thuyết Toán Học Của Mật Mã’ năm 1945. Bài báo ngay lập tức bị xếp vào tối mật, quá nhạy cảm không thể xuất bản.
Shannon cho biết chính công việc này đã dẫn ông đến việc phát triển lý thuyết thông tin của mình. Tuy nhiên, mãi đến những năm 1970 - với sự ra đời của mạch tích hợp điện tử và các chip bán dẫn tốc độ xử lý cao - các kỹ sư mới bắt đầu khai thác lý thuyết thông tin một cách toàn diện và đầy đủ. Những hiểu biết lúc bấy giờ của Shannon giúp định hình hầu như tất cả các hệ thống mật mã, lưu trữ dữ liệu, xử lý hoặc truyền thông tin dưới dạng kỹ thuật số ngày nay.
Lời tiên đoán về trí tuệ nhân tạo
Năm 1950, Shannon công bố trên tạp chí Scientific American một nghiên cứu mô tả cách lập trình cho máy tính chơi cờ vua. Ông đã đi sâu vào cách thiết kế chương trình máy tính với các cấu trúc dữ liệu được lưu giữ trong bộ nhớ, ước tính số bit cần thiết cho bộ nhớ và chia nhỏ chương trình thành những phần mà ông gọi là chương trình con. Đó cũng là các kiến thức cơ bản mà bất cứ người lập trình nào ngày nay cũng phải nắm. Shannon đã làm tất cả những điều này vào thời điểm mà cả thế giới chỉ có chưa đến 10 chiếc máy tính còn hết sức thô sơ.
Theo lời kể của các đồng nghiệp cũ, trong quá trình tìm hiểu để chế một cỗ máy tính biết chơi cờ vua Shannon đã trở nên đam mê chơi cờ ngay tại phòng làm việc, đến nỗi "người phụ trách của ông trở nên lo lắng". Shannon hồn nhiên và vui vẻ nói "Tôi luôn theo đuổi sở thích của mình mà không quan tâm nhiều đến giá trị cuối cùng hoặc đối với thế giới xung quanh. Tôi đã dành nhiều thời gian cho những thứ hoàn toàn vô ích".
Claude Shannon chơi cờ vua. Ảnh: Nokia
Vào lúc bấy giờ, không có sẵn máy tính để ông kiểm tra các ý tưởng của mình về máy chơi cờ. Mãi đến năm 1955, Arthur Samuel, một kỹ sư của IBM, người có nhiệm vụ thử các máy tính của IBM trước khi giao chúng cho khách hàng, đã chạy một chương trình chơi cờ sử dụng phương pháp của Shannon. Năm 1959 Samuel đã công bố một bài báo về phương pháp đó của Shannon với tiêu đề lần đầu tiên có cụm từ "machine learning (máy học)", một thuật ngữ quen thuộc với những người làm về công nghệ AI ngày nay. Không phải ngẫu nhiên mà chiếc máy tính Deep Blue của IBM đã đánh bại đại kiện tướng, vô địch cờ vua Garry Kasparov năm 1997.
Ông cũng tự chế tạo một cỗ máy có thể đánh bại bất kỳ người chơi cờ nào trong một trò chơi với bàn cờ có tên là Hex [4]. Thực ra, Shannon đã khéo léo chỉnh lại bàn cờ làm cho bên của người chơi có nhiều ô hơn. Với một vài mẹo tinh vi khác chiếc máy chơi tự động của Shannon đã dánh bại tất cả kỳ thủ tham gia thi đấu. Andrew Gleason, một nhà toán học lỗi lạc của đại học Harvard, đã thách đấu và tuyên bố rằng không cỗ máy nào có thể đánh bại được ông. Chỉ đến khi Gleason, sau khi bị đánh bại tơi tả, đòi một trận tái đấu, Shannon mới tiết lộ bí mật của cỗ máy.
Shannon đã gợi ý rất sớm rằng việc áp dụng lý thuyết thông tin vào các hệ thống sinh học có thể không phải là điều quá xa vời. Ông nói rằng "Hệ thần kinh là một hệ thống giao tiếp phức tạp và nó xử lý thông tin theo những cách phức tạp". Khi được hỏi liệu ông có nghĩ rằng máy móc có thể "suy nghĩ" hay không, ông trả lời: " Tôi là một cỗ máy và bạn cũng là một cỗ máy, và cả hai chúng ta đều suy nghĩ, đúng không?"
Khi nói về triển vọng của trí tuệ nhân tạo, Shannon lưu ý rằng máy tính những năm 1970 mặc dù có sức mạnh phi thường, vẫn "chưa đạt đến trình độ con người" về mặt xử lý thông tin, và nói thêm rằng "với tôi, chắc chắn là trong vài thập kỷ nữa, máy móc sẽ vượt xa con người".
Từ cuối những năm 1950 trở đi, Shannon công bố rất ít và hiếm khi xuất hiện. Mãi cho đến năm 1985 ông bất ngờ đến dự Hội nghị lý thuyết thông tin quốc tế ở Brighton, Anh. Khi tin tức lan truyền khắp các phòng họp rằng người đàn ông tóc trắng với nụ cười e thẹn, đi ra đi vào các phòng họp không ai khác chính là Claude Shannon, một số người tại hội nghị thậm chí còn không biết ông vẫn còn sống.
Tại bữa tiệc, những người tổ chức hội nghị đã thuyết phục được Shannon phát biểu trước cử tọa. Ông nói chỉ trong vài phút và sau đó sợ rằng mình đang làm mọi người chán, bèn rút ba quả bóng ra khỏi túi và bắt đầu tung hứng. Mọi người reo hò và xếp hàng để xin chữ ký. Giáo sư McEliece, chủ tịch hội nghị cho biết cảm tưởng của tất cả mọi người lúc đó "Giống như Newton xuất hiện tại một hội nghị vật lý vậy".
Shannon đã nhận được trao nhiều giải thưởng cao quí, trong đó có National Medal of Science (giải thưởng danh giá nhất về khoa học ỏ Mỹ); Kyoto Prize (tương đương với giải Nobel của Nhật Bản); và Medal of Honor của IEEE (giải thưởng cao quí nhất về kỹ thuật). Ông mất năm 2001.
---
Tài liệu tham khảo:
[1] Sách "A Mind at Play: How Claude Shannon Invented the Information Age" (Simon & Schuster, 2017)
[2] Celebrating Claude Shannon The engineer’s life disproves the myth that only scientists make discoveriesG. Pascal Zachary23 Mar 2016, IEEE Spectrum, https://spectrum.ieee.org/celebrating-claude-shannon
[3] Jon Gertner ‘The Idea Factory - Bell Labs and the Great Age of American Innovation’, THE PENGUIN PRESS, New York 2012.
[4] Claude Shannon: Tinkerer, Prankster, and Father of Information Theory, IEEE Spectrum, https://spectrum.ieee.org/claude-shannon-tinkerer-prankster-and-father-of-information-theory