Cognition, một phòng thí nghiệm AI ứng dụng có trụ sở tại Hoa Kỳ, đã giới thiệu những gì họ tuyên bố là phần mềm kỹ sư AI đầu tiên trên thế giới. Theo các nhà sáng lập, đại lý AI này, tên là Devin, đã thành công trong việc vượt qua các cuộc phỏng vấn kỹ thuật thực tế do các công ty AI hàng đầu tổ chức.
Devin cũng được cho là đã hoàn thành các công việc thực tế đăng trên Upwork, một nền tảng freelancer của Mỹ.
“Devin là một đồng đội không mệt mỏi, có kỹ năng, sẵn sàng cùng bạn xây dựng hoặc hoàn thành độc lập các nhiệm vụ để bạn xem xét. Với Devin, các kỹ sư có thể tập trung vào những vấn đề thú vị hơn, và các nhóm kỹ thuật có thể hướng tới những mục tiêu tham vọng hơn,” theo bài đăng chính thức trên blog của công ty.
Đại lý AI này được trang bị các khả năng tiên tiến trong phát triển phần mềm, bao gồm lập trình, gỡ lỗi, giải quyết vấn đề và nhiều hơn nữa. Devin sử dụng các thuật toán học máy để liên tục học hỏi và nâng cao hiệu suất, thích nghi với các thử thách mới khi chúng xuất hiện. Nói đơn giản, Devin có thể xây dựng và triển khai các ứng dụng từ đầu đến cuối, đồng thời tự đào tạo và tinh chỉnh các mô hình AI của chính nó.
Devin có khả năng lập kế hoạch và thực hiện các nhiệm vụ kỹ thuật phức tạp thường liên quan đến hàng nghìn quyết định. Khả năng này được hỗ trợ bởi những tiến bộ của Cognition trong lĩnh vực suy luận và lập kế hoạch dài hạn. Theo công ty, Devin có thể truy xuất ngữ cảnh phù hợp ở từng giai đoạn, tự học hỏi theo thời gian và sửa lỗi khi cần thiết.
Trên benchmark SWE-Bench (một tiêu chuẩn đánh giá các mô hình ngôn ngữ lớn về các vấn đề phần mềm thực tế trên GitHub), Devin đã giải quyết chính xác 13,86 phần trăm các vấn đề mà không cần trợ giúp, so với 1,96 phần trăm của chế độ không trợ giúp và 4,80 phần trăm của chế độ trợ giúp của mô hình tiên tiến trước đó.
Mặc dù công ty đã chi tiết hóa khả năng của Devin, một số chuyên gia bày tỏ lo ngại rằng kỹ sư phần mềm AI này có thể gặp khó khăn với các yêu cầu phức tạp hoặc các tình huống phụ thuộc vào trực giác và sáng tạo của con người. Ngoài ra, các công cụ AI như Devin còn gây ra những lo ngại về khả năng thay thế công việc.
Tuy nhiên, một số người tin rằng Devin có thể trở thành một đối tác quý giá cho nhiều kỹ sư phần mềm, mở ra những cơ hội hợp tác mới giữa sáng tạo của con người và AI.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
INTRODUCING | World’s First AI Software Engineer, Devin, Has Completed Real Jobs on Upwork
Cognition, một phòng thí nghiệm AI ứng dụng có trụ sở tại Hoa Kỳ, đã giới thiệu những gì họ tuyên bố là phần mềm kỹ sư AI đầu tiên trên thế giới. Theo các nhà sáng lập, đại lý AI này, tên là Devin, đã thành công trong việc vượt qua các cuộc phỏng vấn kỹ thuật thực tế do các công ty AI hàng đầu tổ chức.
Devin cũng được cho là đã hoàn thành các công việc thực tế đăng trên Upwork, một nền tảng freelancer của Mỹ.
“Devin là một đồng đội không mệt mỏi, có kỹ năng, sẵn sàng cùng bạn xây dựng hoặc hoàn thành độc lập các nhiệm vụ để bạn xem xét. Với Devin, các kỹ sư có thể tập trung vào những vấn đề thú vị hơn, và các nhóm kỹ thuật có thể hướng tới những mục tiêu tham vọng hơn,” theo bài đăng chính thức trên blog của công ty.
Đại lý AI này được trang bị các khả năng tiên tiến trong phát triển phần mềm, bao gồm lập trình, gỡ lỗi, giải quyết vấn đề và nhiều hơn nữa. Devin sử dụng các thuật toán học máy để liên tục học hỏi và nâng cao hiệu suất, thích nghi với các thử thách mới khi chúng xuất hiện. Nói đơn giản, Devin có thể xây dựng và triển khai các ứng dụng từ đầu đến cuối, đồng thời tự đào tạo và tinh chỉnh các mô hình AI của chính nó.
Devin có khả năng lập kế hoạch và thực hiện các nhiệm vụ kỹ thuật phức tạp thường liên quan đến hàng nghìn quyết định. Khả năng này được hỗ trợ bởi những tiến bộ của Cognition trong lĩnh vực suy luận và lập kế hoạch dài hạn. Theo công ty, Devin có thể truy xuất ngữ cảnh phù hợp ở từng giai đoạn, tự học hỏi theo thời gian và sửa lỗi khi cần thiết.
Trên benchmark SWE-Bench (một tiêu chuẩn đánh giá các mô hình ngôn ngữ lớn về các vấn đề phần mềm thực tế trên GitHub), Devin đã giải quyết chính xác 13,86 phần trăm các vấn đề mà không cần trợ giúp, so với 1,96 phần trăm của chế độ không trợ giúp và 4,80 phần trăm của chế độ trợ giúp của mô hình tiên tiến trước đó.
Mặc dù công ty đã chi tiết hóa khả năng của Devin, một số chuyên gia bày tỏ lo ngại rằng kỹ sư phần mềm AI này có thể gặp khó khăn với các yêu cầu phức tạp hoặc các tình huống phụ thuộc vào trực giác và sáng tạo của con người. Ngoài ra, các công cụ AI như Devin còn gây ra những lo ngại về khả năng thay thế công việc.
Tuy nhiên, một số người tin rằng Devin có thể trở thành một đối tác quý giá cho nhiều kỹ sư phần mềm, mở ra những cơ hội hợp tác mới giữa sáng tạo của con người và AI.