AI giúp xe tự hành tránh chạy không tải lúc đèn đỏ
Không ai thích đứng chờ đèn đỏ. Nhưng các giao lộ có đèn báo thường không chỉ gây ra những phiền toái nho nhỏ cho tài xế; các loại xe thường tiêu thụ nhiên liệu và phát thải khí nhà kính trong khi chờ đèn giao thông thay đổi tín hiệu.
Liệu những người lái xe máy có thể tốn ít thời gian trên đường hơn khi họ đến các giao lộ đúng lúc đèn xanh? Dù có thể là may mắn cho những người cầm lái nhưng liệu nó có thể là may mắn có thể đạt được với một chiếc xe tự hành sử dụng trí tuệ nhân tạo (AI) để kiểm soát tốc độ?
Trong một nghiên cứu mới, các nhà nghiên cứu MIT đã triển khai một cách tiếp cận học máy có thể học cách kiểm soát một đoàn xe tự hành khi chúng đi qua một giao lộ có tín hiệu đèn giao thông theo một cách có thể giữ cho luồng giao thông “ngon trớn”.
Với việc sử dụng các mô phỏng, họ phát hiện ra cách tiếp cận của mình giảm thiểu được sự tiêu thụ nhiên liệu và phát thải khí trong khi cải thiện được tốc độ di chuyển. Kỹ thuật này đem lại các kết quả tốt nhất trong trường hợp các xe trên đường đều là xe tự hành nhưng nếu ngay cả chỉ 25% số xe sử dụng thuật toán điều khiển vận hành thì nó vẫn đem lại khả năng tiêu thụ nhiên liệu bền vữn và lợi ích về giảm thiểu phát thải.
“Đây thực sự là nơi thú vị cho các giải pháp can thiệp. Không có cuộc sống của ai đó trở nên tốt đẹp hơn hoặc tệ hơn khi bị mắc kẹt ở một giao lộ. Tuy nhiên nếu có rất nhiều giải pháp làm thay đổi khí hậu thì sẽ có một chất lượng cuộc sống khác hẳn”, theo nhận xét của Cathy Wu, trợ lý giáo sư Khoa Kỹ thuật môi trường và dân dụng MIT và thành viên của Viện Dữ liệu, hệ thống và xã hội (IDSS), Phòng thí nghiệm thông tin và hệ ra quyết định (LIDS) – tác giả chính của nghiên cứu.
Tác giả thứ nhất của nghiên cứu là Vindula Jayawardana, một nghiên cứu sinh ở LIDS và Khoa Kỹ thuật điện và khoa học máy tính. Nghiên cứu này sẽ được trình bày tại Hội nghị Điều khiển châu Âu (European Control Conference).
Những phức tạp của giao lộ
Dẫu con người có thể từng băng qua đường lúc đèn xanh mà không cần phải nghĩ nhiều, có thể có hàng tỉ kịch bản khác nhau ở các giao lộ, phụ thuộc vào số lượng làn đường, cách vận hành tín hiệu, số lượng xe, tốc độ vận hành và sự hiện diện của người đi bộ và đi xe đạp…
Các cách tiếp cận cụ thể cho các vấn đề điều khiển giao lộ sử dụng các mô hình toán học chỉ để giải quyết một giao lộ lý tưởng và đơn giản. Điều đó có vẻ tốt trên lý thuyết nhưng dường như không phù hợp trong thế giới thực, nơi các mẫu hình giao thông thường có rất nhiều hỗn loạn và lộn xộn.
Wu và Jayawardana chuyển hướng và cách tiếp cận vấn đề bằng việc sử dụng kỹ thuật học tăng cường (không mô hình). Học tăng cường là một phương pháp thử và sai nơi thuật toán kiểm soát học được cách ra một chuỗi quyết định. Nó cũng có phần thưởng nếu tìm ra một chuỗi tốt. Với học tăng cường sâu, thuật toán này là đòn bẩy cho các giả định được một mạng thần kinh học để tìm đường tắt cho một chuỗi quyết định tốt, ngay cả có hàng tỉ khả năng có thể.
Điều này hữu dụng để giải quyết một bài toán tồn tại lâu như vậy; thuật toán điều khiển phải đem lại hơn 500 chỉ lệnh gia tốc cho một chiếc xe trong một khoảng thời gian dài, Wu giải thích.
“Và chúng tôi phải có được một chuỗi đúng trước khi chúng tôi biết mình đã làm xong việc giúp giảm thiểu khí thải và đặt một tốc độ đúng để đến một giao lộ lúc đèn xanh”, cô cho biết thêm.
Nhưng còn có thêm một vấn đề. Các nhà nghiên cứu muốn một hệ học được một chiến lược giảm thiểu việc tiêu thụ nhiên liệu và giới hạn được thời gian di chuyển. Các mục tiêu này có thể xung đột với nhau.
“Để giảm thiểu thời gian đi lại, chúng tôi muốn ô tô đi nhanh nhưng vẫn giảm thiểu phát thải, chúng tôi muốn đi chậm lại hoặc không chuyển động… Những hàm thưởng cạnh tranh như thế này có thể gây bối rối”, Wu nói.
Việc giải quyết vấn đề này một cách tổng quát và đầy đủ thực sự là một thách thức. Do đó, các nhà nghiên cứu đã sử dụng một giải pháp khác bằng cách sử dụng một kỹ thuật được gọi là định hình phần thưởng. Với kỹ thuật định hình phần thưởng, hệ thống được cung cấp một số kiến thức miền mà nó không thể tự học được. Trong trường hợp này, hệ thống bị “phạt” bất cứ khi nào xe dừng hẳn, vì vậy nó sẽ học cách tránh hành động đó.
Các thử nghiệm giao thông
Khi đã phát triển được một thuật toán kiểm soát hiệu quả, họ đánh giá nó bằng việc sử dụng một nền tảng mô phỏng giao thông với một giao lộ. Thuật toán điều khiển được ứng dụng cho một dòng xe tự hành có kết nối, có thể truyền tin về tín hiệu đèn giao thông phía trước để nhận các pha tín hiệu và thông tin thời gian và quan sát môi trường xung quanh. Thuật toán điều khiển có thể “nói” với mỗi chiếc xe về cách tăng tốc và giảm tốc độ.
Hệ thống của họ không tự tạo ra được một giao thông dừng và đi như cách các chiếc xe tiếp cận giao lộ (dừng và đi xuất hiện khi các loại xe đến một điểm dừng hoàn toàn tùy thuộc vào dòng giao thông). Trong thế giới mô phỏng, nhiều chiếc xe đã vượt qua được trong một pha xanh duy nhất, tốt hơn mô hình mô phỏng người lái xe. Khi so sánh với các phương pháp tối ưu hóa khác cũng được thiết kế để tránh hiện tượng dừng và đi thì kỹ thuật của MIT dẫn đến mức giảm tiêu thụ nhiên liệu và giảm lượng khí thải lớn hơn. Nếu mọi chiếc xe trên đường đều là xe tự hành, hệ điều khiển của chúng có thể giảm mức tiêu thụ nhiên liệu tới 18% và 25% lượng khí thải carbon dioxide, đồng thời tăng tốc độ di chuyển lên 20%.
“Một biện pháp can thiệp đơn lẻ cũng có thể làm giảm đi 20 đến 25% lượng nhiên liệu hay phát thải, thực sự không thể tin được. Nhưng những gì tôi phát hiện ra còn thú vị hơn và thực sự đem lại hi vọng là điều này không bị giới hạn. Nếu chúng ta chỉ kiểm soát được 25% lượng xe thôi thì chúng ta cũng thu được 50% lợi ích về giảm nhiên liệu và phát thải. Điều đó có nghĩa là chúng ta không cần chờ cho đến khi chúng ta dùng 100% xe tự hành để đạt được lợi ích từ cách tiếp cận này”, cô nói.
Các nhà nghiên cứu muốn tìm hiểu về hiệu quả tương tác giữa đa giao lộ. Họ muốn lên kế hoạch khám phá những thiết kế giao lộ khác nhau (số lượng làn đường, tín hiệu, thời gian giữa các tín hiệu…) có thể ảnh hưởng như thế nào đến thời gian di chuyển, phát thải và tiêu thụ nhiên liệu. Thêm vào đó, họ muốn nghiên cứu về cách hệ điều khiển có thể tác động đến độ an toàn giao thông khi xe tự hành và xe người lái cùng nhau đi trên đường. Ví dụ, ngay cả khi xe tự hành có thể định hướng một cách khác biệt với xe người lái, các con đường chậm hơn và các con đường với các tốc độ bền vững hơn có thể cải thiện được độ an toàn, Wu nói.
Dẫu công trình này mới chỉ ở những giai đoạn đầu tiên thì Wu đã thấy cách tiếp cận này là một trong những cách có thể khả thi trong tương lai gần.
“Mục tiêu của công trình này là để chuyển đến một sự di chuyển bền vững. Chúng tôi muốn mơ mộng nhiều hơn nhưng các hệ này đều là những con thú trì trệ khổng lồ. Việc nhận diện các điểm can thiệp là những thay đổi nhỏ với hệ này nhưng có tác động đáng kể lên điều chúng ta có thể đón nhận vào mỗi buổi sáng khi thức dậy”, cô nói.
Thanh Phương tổng hợp
Nguồn: https://news.mit.edu/2022/ai-autonomous-driving-idle-0517
https://techxplore.com/news/2022-05-artificial-intelligence-autonomous-vehicles-idling.html