Khoa học hệ phức hợp: Giải những bài toán phức tạp của khoa học và xã hội

Với khả năng giải được những bài toán lớn và phức tạp, khoa học hệ phức hợp sẽ đem lại cơ hội cho con người có được những giải pháp hiệu quả ở nhiều lĩnh vực.


Mỗi hệ sinh thái trên Trái đất đều là một hệ phức hợp. Nguồn: Photo by NASA/UPI.

Nhà vật lý Stephen Hawking đã từng nói trong thế kỷ trước “Tôi cho rằng thế kỷ tới (thế kỷ 21) sẽ là thời đại của hệ phức hợp. Chúng ta đã khám phá ra các định luật cơ bản chi phối vật chất và thông hiểu mọi hiện tượng thông thường nhưng lại không hiểu các định luật đó tương thích với nhau như thế nào và điều gì sẽ xảy ra ở những thời điểm cực điểm? Tôi kỳ vọng là chúng ta sẽ tìm ra một lý thuyết thống nhất hoàn chỉnh trong thế kỷ tới. Với lý thuyết đó, chúng ta có thể xây dựng được những thứ có độ phức tạp vô hạn”.

Những đặc điểm riêng biệt của hệ phức hợp

Vậy hệ phức hợp mà Stephen Hawking đề cập đến ở đây là gì? Nó được định nghĩa là một hệ thống gồm rất nhiều phần tử tương tác chặt chẽ với nhau, có khả năng tự tổ chức với nhau (self-organized) và biến đổi tiến hóa (adapt) để thích nghi với môi trường. Các phần tử trong hệ thường có tính chất đơn giản nhưng sự tương tác giữa chúng tạo ra tính “phức hợp” của hệ. Do đó, tính chất của hệ gồm nhiều phần tử đơn lẻ hợp nhất lại có tính chất khác rất xa với tính chất của từng phần tử riêng lẻ.

Nghe thì có vẻ phức tạp nhưng xung quanh chúng ta có vô vàn ví dụ về hệ phức hợp như hệ sinh thái, một nền kinh tế, mạng Internet, mạng xã hội, mạng truyền tải điện, mạng giao thông, hệ địa chất, hệ miễn dịch trong cơ thể, bộ não sinh học, một đàn kiến đông, virus lan truyền trong xã hội, hệ thời tiết… Chúng ta hãy nhìn vào hai hệ phức hợp, một là bộ não sinh học và một là hệ nhân tạo – mạng Internet.


Figure 1: Bản đồ khoa học Hệ phức hợp – nguồn: Castellani, Brian (2018) ‘Map of the Complexity Sciences.’ Art & Science Factory.

Nhìn chung, các hệ phức hợp có những tính chất đặc biệt hơn với 8 đặc điểm mà khó có thể xuất hiện ở các hệ khác:

Tính thích nghi (adapt): các phần tử của hệ khi tương tác với các phần tử khác có thể thay đổi hành vi của mình và thích ứng với môi trường.

Tính tự tổ chức (self-organized): khi biến đổi thích ứng, các phần tử có thể tương tác và hệ tự diễn biến về một trạng thái dừng (mà không cần bộ phận điều khiển trung tâm).

Tính đột sinh (emergence): hệ có thể xuất hiện những hình dạng/cấu trúc và hành vi mới mà không thể đoán được nếu chỉ dựa trên các định luật cơ bản của phần tử thành phần hoặc chính.

Điểm hút (attractor): là những trạng thái mà hệ có thể tiến hóa đến mặc dù điều kiện ban đầu của thời điểm tiến hóa khác nhau.
 

Figure 2: a) Bộ não con ruồi với 25,000 neuron và 25 triệu dây thần kinh là một hệ phức hợp – nguồn: Google và b) Mạng Internet IPv4 có 47,610 Autonomous Systems’ (ASes) và 148,455 kết nối – nguồn: caida.org

Tính hỗn loạn (chaos): là những biến đổi không dự đoán được và rất nhạy cảm với điều kiện ban đầu. Sự hỗn loạn này thường không kiểm soát được và phải mất một thời gian hệ mới ổn định lại (Nhiều khi hệ phức hợp được hiểu nhầm là hệ hỗn loạn – chaotic system – dù hệ phức hợp có tính chất rộng hơn)

Tính tự tổ chức quan trọng (self-organized criticality): có một số điểm hút mà hệ tự tiến hóa về và dừng lại, sau đó hệ diễn biến rất đột ngột với cường độ trải dài trong một khoảng rộng và không đoán được. Về dài hạn thì cường độ này tuân theo một phân bố phổ biến là luật hàm mũ.

Sự chuyển pha: Tính tự tổ chức quan trọng là điểm xảy ra sự chuyển pha. Sự chuyển pha này thường diễn ra đột ngột, cường độ mạnh và có thể là quá trình không đảo ngược được. (Sự chuyển pha trong các hệ tự nhiên đã được nghiên cứu nhiều như nước đá tan thành nước,… và có thể vận dụng các kiến thức này nhưng sự chuyển pha trong các hệ phức hợp phức tạp hơn).
Tính phi tuyến: rất nhiều biến đổi của hệ có tính phi tuyến và để dự báo được cần nhiều các thuật toán phi tuyến phức tạp và các lý thuyết xác suất.

Trong số này, có thể thấy ba đặc điểm tiêu biểu nhất của hệ phức hợp là tính thích nghi, tính đột sinh và tính hỗn loạn. Chúng ta thử nhìn vào ba hệ phức hợp tiêu biểu là mạng Internet (cần phân biệt với mạng WWW), một nền kinh tế và một bộ não sinh học trong bảng phân định tính chất sau (bảng dưới).

Network

Adaptable

Emergence

Chaos

Mạng Internet

Sự phát triển và mở rộng mạng phù hợp với địa lý và nhu cầu liên lạc

Sự lan truyền thông tin có thể gây nghẽn mạng

Các nút/router có thể bị ngắt đồng thời trên diện rộng và không kiểm soát

Nền kinh tế

Sự phát triển kinh tế thỏa mãn các nhu cầu tiêu dùng của con người

Khủng hoảng xuất hiện sau một thời gian phát triển tốt đẹp

Cung/cầu đổi chiều liên tục trong một thời gian ngắn

Bộ não sinh học

Các kết nối dây thần kinh thay đổi phù hợp với sự tiến hóa

Các phát minh bột phát sau qua trình suy nghĩ

Mất trí nhớ

Mở rộng cách tiếp cận đa ngành

Tuy còn ở giai đoạn sơ khai nhưng các nghiên cứu khoa học về hệ phức hợp đang trở thành một hướng quan trọng và thu hút sự chú ý của các nhà nghiên cứu đa ngành như vật lý thống kê, Toán học, Lý thuyết thông tin, Hệ động lực, Kinh tế học, Sinh học, Xã hội học,… Không phải ngẫu nhiên mà trong 22 chương trình (sáng kiến) KH&CN của lộ trình tới năm 2050 của Trung Quốc có bốn sáng kiến về “nghiên cứu cơ bản” và ba sáng kiến về “nghiên cứu liên ngành và tiên tiến”, trong đó Hệ phức hợp là một hướng nghiên cứu liên ngành trọng tâm.

Trên con đường thực hiện nghiên cứu về các hệ phức hợp, các nhà khoa học đã bắt đầu có xu hướng đi về hai nhánh nhỏ hơn là nghiên cứu về cấu trúc của hệ và quá trình động lực trong hệ. Tuy là hai nhánh có phần tách biệt nhưng chúng lại có thể kết hợp và bổ sung cho nhau bởi việc hiểu cấu trúc sẽ giúp người ta có thể mô tả tốt hơn các quá trình diễn ra trên hệ.

Khi nghiên cứu về cấu trúc của hệ, người ta tập trung vào tính liên kết, phân bố liên kết, tương quan bậc; Trọng số, phân bố trọng số; tính phân nhóm; Sự biến đổi cấu trúc theo thời gian; Mạng lưới siêu lớn (không xác định được kích thước); Biểu diễn hình ảnh. Còn với nghiên cứu về quá trình động lực (dynamic process) diễn ra trong hệ thì mục tiêu là vào quá trình hình thành, xây dựng hệ; Quá trình tan rã, phá hủy hệ; Quá trình lan truyền thông tin/dịch bệnh và điều khiển ngăn chặn; Các quá trình chuyển pha và đột phát; Mô phỏng và dự báo…

Do đó, việc nghiên cứu này sẽ có khả năng đem lại những kết quả có tác động thực sự đến cả nghiên cứu cơ bản và ứng dụng, đặc biệt giải quết được nhiều vấn đề hiện hữu của xã hội mà ở thời điểm này, chúng ta chưa có được giải pháp thật sự hoàn chỉnh và triệt để, ví dụ như tăng cường sự ổn định và phòng ngừa khả năng đổ vỡ dây chuyền của các hệ như Internet, mạng lưới truyền tải điện, mạng lưới giao thông,…; Hiểu rõ và điều khiển các quá trình lan truyền (thông tin, dịch bệnh,…); Dự báo xã hội (khủng hoảng kinh tế) và đề xuất các chính sách ổn định; Phát triển các thuật toán AI dựa trên sự hiểu biết về các tương tác giữa nơron trong não bộ, tiến đến trí thông minh tiến hóa; Phát triển các máy AI hoặc cấu trúc máy tính mới dựa trên các cấu trúc Vật lý hoàn toàn mới; Hỗ trợ các phát minh sinh học và y tế dựa trên sự hiểu biết về tương tác trong các hệ vi sinh…

Figure 3: a) (Trái) Mạng lưới 500 sân bay thương mại lớn nhất của nước Mỹ – nguồn dữ liệu: (Dall’Asta et al. 2006) và b) (Phải) đồ thị tần số (historgram) của bậc của các đỉnh trong mạng sân bay.

Hiện nay, các nhà khoa học trên thế giới thường áp dụng hai phương pháp nghiên cứu chính đối với hệ phức hợp là:

1. Mô phỏng đa tác nhân (Agent-based modeling): đây là cách tiếp cận dạng “bottom-up” bằng cách mô phỏng số lượng lớn các tác nhân có tính chất và hành vi của hệ thực cần nghiên cứu. Kết quả mô phỏng sẽ cho ra một hệ ảo và có thể xác định được cấu trúc, hoặc tiếp tục sử dụng để mô phỏng các quá trình động học trong hệ.

Hướng nghiên cứu này có lợi điểm là mô phỏng được số lượng lớn tác nhân, mô phỏng hệ có quan hệ phức tạp,… nhưng lại vấp phải nhược điểm là thiếu các lý thuyết, mô hình hỗ trợ.

2. Khoa học mạng lưới (Network Science): một điều dễ dàng khi áp dụng phương pháp này là hầu hết các hệ phức hợp có thể mô tả bằng một mạng lưới, hay một đồ thị trong ngôn ngữ Toán học.
Cách tiếp cận này có thể tận dụng được các lý thuyết và mô hình từ lý thuyết đồ thị, vật lý thống kê,… Các mô hình được xây dựng từ đơn giản đến phức tạp nên có tính hệ thống hơn.

Ví dụ về hình ảnh của mạng lưới 500 sân bay lớn trên nước Mỹ cho thấy một sân bay trung bình chỉ có gần 6 đường bay nội địa? Tuy nhiên có rất nhiều sân bay nhỏ chỉ kết nối với một vài sân bay chính gần đó (Có đến 74 sân bay chỉ kết nối duy nhất 1 sân bay khác trong số 500 sân bay lớn, 107 sân bay kết nối với 2 sân bay khác). Ngược lại, nhiều sân bay là trạm kết nối và sân bay kết nối nhiều nhất có đến 146 đường bay khác nhau, như thể hiện qua đồ thị tần số (histogram) dưới đây.

Khoa học mạng lưới cho ta biết điều gì?

Một mạng lưới có thể biểu diễn toán học như một tập hợp các đỉnh và các cạnh nối giữa hai đỉnh trong tập hợp. Tùy theo sự kết nối của các cạnh mà mạng lưới có hình dạng và cấu trúc rất đa dạng. 

Trên thực tế, những bài toán mà khoa học mạng lưới có thể giải quyết được vô cùng gần gũi với chúng ta, ví dụ tìm mối liên kết trong Mạng xã hội các trang web người nổi tiếng, Mạng các quan hệ kinh tế, Mạng lưới 500 sân bay lớn của Mỹ, Mạng lưới cộng tác khoa học… Khi dựa trên tính chất phân bố đỉnh theo hàm mũ, chúng ta có thể mô hình hóa được mạng lưới những mối quan hệ có thật trong xã hội đó. 

Các khảo sát thực nghiệm cho thấy hầu hết các mạng lưới thực tế có số bậc của mỗi đỉnh phân bố theo dạng hàm mũ, phản ánh tính khác biệt về tương tác rất lớn: một số đỉnh/đối tượng nhỏ tương tác với rất nhiều đỉnh/đối tượng khác trong khi phần lớn các đỉnh/đối tượng khác chỉ tương tác với một số nhỏ cá nhân khác. Nó cho thấy các mạng thực tế có tính gần gũi với nhau, đây là hiện tượng nổi tiếng “Six degrees of separation” (tạm dịch là sáu bậc phân tách) do Frigyes Karinthy phát hiện và được John Guare viết lại. Nó cho chúng ta thấy một điều thật bất ngờ: hai người bất kỳ trong xã hội có thể kết nối với nhau chỉ qua trung bình 6 người trung gian khác. Con số nhỏ này được mô tả thành hiện tượng thế giới nhỏ (the small-world effect).

Chiểu theo cách giải thích này, với mạng gồm 500 sân bay lớn của Mỹ thì đường đi ngắn nhất giữa hai đỉnh bất kỳ chỉ là 2.99 hay gần 3, có nghĩa là để đi từ hai sân bay bất kỳ trên đất Mỹ, người ta chỉ cần đi trung bình 3 chuyến bay.

Trong một ví dụ khác, chúng ta có mạng lưới cộng tác xuất bản chung của các nhà khoa học mạng lưới vào năm 2006. Với mạng lưới bao gồm 1.589 nhà khoa học, bạn muốn liên kết với bất kỳ nhà khoa học nào khác qua các quen biết (ví dụ đã xuất bản chung) thì trung bình cần đến 6 đường đi (hay 5 nhà khoa học giới thiệu).

Nếu dựa vào tính bền vững trước những hỏng hóc ngẫu nhiên và suy yếu trước phá vỡ có chủ đích, chúng ta có thể điểm một kết quả quan trọng. Vào năm 2000, Babarasi và cộng sự đã có một bài báo quan trọng trên Nature cho thấy: mạng Internet rất bền vững trước những hỏng hóc ngẫu nhiên của các đỉnh (router) – mạng chỉ bị sập hoàn toàn nếu có đến 92% số đỉnh bị hỏng một cách ngẫu nhiên. Ngược lại, mạng lại rất yếu nếu các đỉnh có số kết nối cao nhất bị hỏng: chỉ 16% số đỉnh cao nhất bị phá là mạng Internet sẽ ngừng hoạt động dù còn 84% các đỉnh khác vẫn tồn tại. Tính chất này được gọi là sự suy yếu trước phá vỡ có chủ đích do các đỉnh có số kết nối cao bị phá hủy thường do phá hoại. 

Mạng xã hội các Trang người nổi tiếng

Mạng các quan hệ kinh tế

Mạng lưới 500 sân bay lớn của Mỹ

Mạng lưới cộng tác khoa họ


Figure 4: (Trên) Biểu diễn cấu trúc của 4 mạng thực tế khác nhau và (Dưới) phân bố bậc của mạng 500 sân bay tuân theo phân bố hàm mũ (phần đuôi).

Một hướng tiếp cận thành công khác là sử dụng lý thuyết thẩm thấu trong các hệ vật chất giải thích sự bền vững nói trên của các hệ phức hợp với sự đóng góp chính của nhóm của GS. Shmolov Havlin, M. N. Newman cùng cộng sự. Đây là một lý thuyết đã được phát triển trong Toán học và Vật lý nhằm trả lời những câu hỏi điển hình như sau: Một viên đá rỗng được ngâm trong nước. Hỏi với tỷ lệ rỗng của đá là bao nhiêu thì nước có thể thẩm thấu đến hầu hết mọi nơi trong thể tích viên đá?; Trên một mặt hồ đóng băng một phần, hỏi xác suất một người có thể đi trên băng từ bờ bên này tới bờ bên kia phụ thuộc như thế nào vào tỷ lệ đóng băng của mặt hồ.
***
Việc áp dụng khoa học mạng lưới cả khía cạnh lý thuyết và mô phỏng trên dữ liệu các mạng lưới thực, chúng ta có thể nghiên cứu được nhiều tính chất của hệ phức hợp thực tế và trả lời một số câu hỏi sau:

Mạng Internet có bền vững trước những sự cố hỏng hóc hay không? Nếu bị mất đi một số đỉnh (router) thì có thể hoạt động bình thường được không?
Một số sân bay bị đóng/tấn công thì ảnh hưởng đến bao nhiêu lưu lượng hành khách, có dẫn đến ngưng trệ dây chuyền hay không?
Các sự cố mất điện hàng loạt trên lưới điện diễn ra vì sao, như thế nào? làm sao ngăn chặn được sự cố này? (thiết kế lưới như thế nào)
Cần tiêm ngừa bao nhiêu phần trăm dân số để ngăn ngừa lây nhiễm cộng đồng?
Trong y khoa, vì sao một số đột biến gene có thể gây bệnh còn số khác thì không (bản đồ gene).
Các nghiên cứu theo hướng trên mới chỉ ở giai đoạn khởi đầu và còn hứa hẹn nhiều kết quả quan trọng trong tương lai.□

Tác giả