Máy học (Machine learning-ML) và phân tích dự đoán đều là các phân ngành của trí thông minh nhân tạo (AI). Phân tích dự đoán AI sử dụng các kỹ thuật và mô hình máy học (ML) để thu thập kiến thức từ dữ liệu theo thời gian.
Các mô hình này chịu sự huấn luyện-training thông qua sử dụng dữ liệu của quá khứ để nhận dạng và phân tích các mô hình/mô thức và tương tác qua lại (Ravi và cộng sự, 2018).
Sau khi được huấn luyện, các mô hình này được dùng để tạo ra các dự đoán về kết quả trong tương lai bằng dữ liệu mới, chưa được dùng trước đó (Hình 1).
Hình 1. Mô tả đơn giản về phân tích dự đoán (Nguồn: Ogirala và cộng sự, 2024).
Dịch bệnh và vệ sinh không bảo đảm là hai trong số nhiều vấn đề mà ngành chăn nuôi sản xuất gà phải đối mặt. Bệnh cầu trùng, Newcastle, Gumboro pullorum và Salmonella là một trong những bệnh phổ biến nhất (Machuve và cộng sự, 2022).
Việc xét nghiệm chẩn đoán các bệnh này có thể tốn kém, mất thời gian và công sức.
Xét nghiệm vi khuẩn trên phân gà có thể tốn trung bình 30 đô la từ các phòng thí nghiệm của Hoa Kỳ (ví dụ: GPLN và các phòng thí nghiệm khác), với giá cả thay đổi tùy theo số lượng gia cầm được xét nghiệm (GPLN, 2024; CEVDL, 2024).
Theo dõi chặt chẽ gia cầm để nhận biết bất kỳ thay đổi nào về biểu hiện hành vi hoặc vẻ bên ngoài của chúng có thể giúp người chăn nuôi gia cầm nhanh chóng xác định và loại bỏ nguyên nhân gây bệnh.
Đây là nơi phân tích dự đoán đã cung cấp một giải pháp đột phá cho ngành gia cầm.
Người quản lý trang trại có thể thực hiện các biện pháp thích hợp ngay cả trước khi bệnh biểu hiện ra các dấu hiệu lâm sàng, nhờ vào các mô hình phân tích dự đoán có thể đưa ra kết quả từ dữ liệu lịch sử và dữ liệu đầu vào theo thời gian thực để dự báo các đợt bùng phát dịch bệnh.
Phân tích hiện đại, dưới dạng thuật toán máy học và được hỗ trợ bởi công nghệ dữ liệu lớn (big data), kết hợp hai điều này bằng cách tạo điều kiện cho sự phân tích có thể phát hiện các mô hình/mô thức hiện tại và dự đoán các bệnh trong tương lai.
THU THẬP VÀ QUẢN LÝ DỮ LIỆU
Hồ sơ sức khỏe vật nuôi, bao gồm lịch sử chủng ngừa, hồ sơ dùng thuốc và chẩn đoán bệnh trước đó, là một tập dữ liệu quan trọng.
Tiếp tục sau quảng cáo.
Phân tích dữ liệu này rất cần thiết để lập mô hình hóa nguy cơ bệnh tốt hơn và nắm được các dạng vấn đề sức khỏe dù tạm thời nhưng có thể lây lan trong toàn bộ đàn (Huang và cộng sự, 2019).
Quy mô và độ phức tạp của các dạng dữ liệu này đòi hỏi phải có hệ thống đáng tin cậy để xử lý, xác thực và sử dụng tất cả thông tin này để đưa ra kết luận theo thời gian thực.
Các thiết bị và cảm biến Internet vạn vật (Internet of Things-IoT) chủ yếu tự động hóa việc thu thập dữ liệu, cung cấp dữ liệu đầu vào liên tục cho các hệ thống quản lý tích hợp.
State-of-the-art databases and cloud storage solutions store the massive amount of data.Cơ sở dữ liệu hiện đại và các giải pháp lưu trữ đám mây (cloud storage) có thể chứa được lượng dữ liệu rất khổng lồ.
Các nền tảng phân tích dữ liệu sử dụng các thuật toán tiên tiến và mô hình máy học để phân tích dữ liệu, tìm kiếm các mối liên hệ hoặc mô hình/mô thức bị ẩn giấu qua nhiều cách thức xử lý và tiến hành dự đoán các kết quả có thể xảy ra (LeCun và cộng sự, 2015) (Hình 3).
Hình 3. Quá trình vận hành của hệ thống giám sát gà dựa trên máy học (Nguồn: Okinda và cộng sự, 2020).
MÔ HÌNH DỰ ĐOÁN PHÁT HIỆN BỆNH
Các kỹ thuật dựa trên ML sử dụng trình trích xuất đặc điểm (feature extractor) để chuyển đổi dữ liệu thô, chẳng hạn như các giá trị pixel từ ảnh, và chuyển thành các vectơ đặc điểm (feature vector).
Ngoài ra, các hệ thống con học tập (learning subsystems) được sử dụng để thực hiện phân tích hồi quy hoặc xác định các mô hình/mô thức trong các đặc điểm thu thập được (LeCun và cộng sự., 2015).
Thuật toán học sâu (Deep learning algorithms), bắt nguồn từ các kỹ thuật máy học thông thường, có khả năng tự động khám phá các đặc điểm hoặc biểu hiện dữ liệu từ dữ liệu thô, loại bỏ nhu cầu hiểu biết kỹ thuật trích xuất đặc điểm (feature extraction engineering) (LeCun và cộng sự, 2015).
Recurrent neural networks, autoencoders, convolutional neural networks, belief networks, generative adversarial networks, and reinforcement learning đều là các mô hình tạo nên cơ sở cấu trúc cho học sâu.
Để giải quyết các vấn đề khó khăn, các mạng lưới học sâu (deep learning networks) cần có hệ thống xử lý hiệu suất cao, tập dữ liệu lớn, phương pháp tối ưu hóa để giữ dữ liệu không thay đổi và cấu trúc mạng phức tạp (complex topologies) (Oyedele và cộng sự, 2021).
Convolutional neural networks được sử dụng rộng rãi trong học sâu nhằm mục đích xử lý hình ảnh kỹ thuật số (Zhuang & Zhang, 2019).
Hầu hết các hệ thống máy học đều sử dụng dữ liệu quá khứ làm đầu vào để dự đoán giá trị đầu ra trong tương lai. Các thuật toán máy học (ví dụ:ANN, SVR, random forest, CNN, GLM) và nhiều mô hình máy học (ví dụ: phân loại, hồi quy, phân cụm-clustering) định nghĩa ML là ở dạng có giám sát (supervised) hoặc không giám sát (unsupervised) (Milosevic và cộng sự, 2019). Các phương pháp máy học có giám sát bảo đảm tính chính xác của phân loại hoặc dự đoán thông qua dữ liệu được gắn nhãn (labelled data).
NGHIÊN CỨU TÌNH HUỐNG
Robertson và Yee đã tạo ra một quy trình (pipeline) tự động hóa trích xuất và phân tích dữ liệu bằng cách sử dụng bốn từ khóa liên quan đến nhiễm AIV (cúm gia cầm) ở gia cầm để kiểm tra các dòng tweet trên Twitter về AIV. Mô hình của họ cho thấy mối quan hệ tích cực giữa các ca cúm gia cầm ở gia cầm được báo cáo bởi Tổ chức Thú y Thế giới và các bài đăng trên Twitter có liên quan đến AIV trong giai đoạn 2015-2016 (Robertson & Yee, 2016).
Belkhiria và cộng sự (2018) đã tạo ra bản đồ phân bố bệnh để dự báo nguy cơ nhiễm vi-rút cúm gia cầm độc lực cao (HPAIV) ở California. Để làm được vậy, họ đã kết hợp nhiều loại dữ liệu, bao gồm số lượng trang trại nuôi gà thịt ở một địa điểm nhất định, khoảng cách đến bờ biển và dữ liệu quá khứ về số lượng nhiễm virus cúm gia cầm độc lực thấp ở các loài chim hoang dã. Bản đồ liên kết các khu vực của California với nguy cơ nhiễm HPAIV, do đó cho phép sử dụng các biện pháp phòng ngừa phù hợp khi có dịch bùng phát.
LỢI ÍCH CỦA VIỆC PHÁT HIỆN SỚM
Một trong những lợi ích chính là giảm đáng kể tỷ lệ gia cầm chết.
Phát hiện sớm giúp giảm đáng kể sự phụ thuộc vào thuốc kháng sinh, thường được dùng như một biện pháp phòng ngừa toàn diện.
Bằng cách ngăn ngừa dịch bệnh, các trang trại có thể tránh tiêu tốn cho những chi phí đáng kể liên quan đến việc tiêu hủy hàng loạt và thiệt hại năng suất.
THÁCH THỨC KHI ÁP DỤNG VÀ GIẢI PHÁP
Các vấn đề về cơ sở hạ tầng, khó khăn về kinh tế và mối quan tâm về quản trị dữ liệu sẽ là một trong những thách thức đối với sự phát triển của một hệ thống chuẩn hóa trong dự báo sự xuất hiện dịch bệnh ở gia cầm.
Không có đủ nguồn lực truy cập internet ở các vùng nông thôn, dẫn đến tình trạng thiếu kết nối. Ngoài ra, việc phát triển các cảm biến và cảm biến sinh học để chẩn đoán nhiễm bệnh ở gia cầm vẫn đang trong giai đoạn sơ khai.
Do đó, cần phải nghiên cứu thêm để tạo ra công nghệ có thể hoạt động hiệu quả trong môi trường chuồng nuôi gia cầm quy mô thương mại.
Việc áp dụng công nghệ mới vào các trang trại đòi hỏi người chăn nuôi phải có kiến thức và được đào tạo về những công nghệ đó. Vấn đề thiên lệch (bias) và nhiễu (noise) trong các nguồn dữ liệu cụ thể là một trở ngại khác mà các thuật toán dự đoán sẽ phải khắc phục được.
Ví dụ, các đánh giá dựa trên các nguồn trên web thường có nhiễu và những dữ liệu vô dụng cần phải xóa (Milinovich và cộng sự, 2014).
Người chăn nuôi có thể gặp phải vấn đề quản trị dữ liệu khi đề nghị các mô hình dự đoán với nhiều người liên quan trong quản trị. Mặc dù các mô hình nên bao gồm thông tin từ càng nhiều trang trại càng tốt để dự đoán sự phát triển của bệnh, nhưng người chăn nuôi sản xuất có thể không muốn dữ liệu của họ được công khai.
Dữ liệu có thể được ẩn danh, nhưng các phương pháp tái nhận dạng vẫn cần được cải thiện (Ferris, 2017).
Cải thiện chất lượng dữ liệu, xây dựng chuyên môn kỹ thuật và giảm các rào cản kinh tế và vận hành sẽ giúp việc áp dụng phân tích dự đoán được hiệu quả, dẫn đến tăng cường khả năng quản lý kiểm soát dịch bệnh và cải thiện hiệu quả hoạt động (Hình 4).
Hình 4. Các Giải Pháp Đề Xuất.
Hơn nữa, Ojo và cộng sự (2022) đã đề xuất một chiến lược nhằm nâng cao chăn nuôi chuẩn xác (precision livestock) để bảo đảm sức khỏe và phúc lợi cho gia cầm một cách thông minh.
Cách tiếp cận của họ đặc biệt giải quyết những trở ngại gặp phải trong các hệ thống hiện tại. Khái niệm này được hình thành thông qua một cuộc kiểm tra toàn diện các phương pháp điều trị trước đó được thực hiện bởi các nhà nghiên cứu trong lĩnh vực quản lý phúc lợi gia cầm.
Khung cơ sở (framework) này sở hữu các đặc tính về khả năng mở rộng (scalability), khả năng phục hồi (resilience), khả năng mở rộng (extensibility) và bảo mật.
Khung cơ sở bao gồm một số thành phần cơ bản, cụ thể là mô-đun học sâu (DL), mô-đun Digital Twin, mô-đun đám mây điện toán/cloud edge (cloud-fog-based), mô-đun thông tin liên lạc, mô-đun bảo mật và mô-đun giao diện người dùng (Hình 5).
Hình 5. Khung cơ sở cho quản lý sức khỏe và phúc lợi gia cầm một cách thông minh (Nguồn: Ojo và cộng sự, 2022).
TRIỂN VỌNG VÀ CÁC PHÁT KIẾN TRONG TƯƠNG LAI
Tương lai của phân tích dự đoán trong chăn nuôi gia cầm dự sẽ là sự cải thiện của trí thông minh nhân tạo (AI) và máy học, cũng như sự tích hợp vào các thiết bị của Internet vạn vật (IOT) và dữ liệu lớn (big data) sẽ cải thiện đáng kể năng suất của các công nghệ này
Để bảo đảm tính khả thi về mặt thương mại và khả năng áp dụng, các hệ thống giám sát gia cầm cần được nghiên cứu và phát triển thêm.
Các phương pháp tiếp cận tích hợp trong khoa học và kỹ thuật chăn nuôi cần phải giải quyết những thách thức này để cải thiện hiệu quả giám sát đàn gà trên nền tảng chăn nuôi chuẩn xác (Precision Livestock Farming-PLF) và tăng khả năng phục hồi của nó (Hình 6).
Hình 6.Triển vọng
HỆ THỐNG ƯỚC TÍNH THỂ TRỌNG
Theo dõi thể trọng vật nuôi trong quá trình phát triển giúp đánh giá được thời điểm giết mổ và kế hoạch cho ăn. Nếu cân nặng đo được đi lệch khỏi đường cong tăng trưởng dự kiến, điều này cho thấy tình trạng sức khỏe như bệnh hoặc các vấn đề quan trọng khác cần phải có biện pháp khắc phục. Do đó, thể trọng có ảnh hưởng đến phúc lợi của động vật.
Khó khăn chính đối với hệ thống ước tính thể trọng gà là sự biến thiên của ánh sáng xung quanh và xác định vị trí của đàn gà.
Cảm biến hình ảnh linh hoạt và camera không đổi độ sáng (illuminant invariant) dùng cho trang trại có thể giải quyết được vấn đề ánh sáng thay đổi. Ước tính thể trọng tận dụng lợi thế của camera độ sâu dựa trên IR như Microsoft Kinect (Mortensen và cộng sự, 2016).
HỆ THỐNG PHÁT HIỆN TÌNH TRẠNG KHẬP KHIỄNG
Khả năng di chuyển vận động là rất quan trọng đối với động vật. Sự di chuyển vận động liên quan đến thể lực và sức khỏe của vật nuôi.
Những con gia cầm gặp khó khăn khi đi lại có thể bị chết đói, giảm hiệu quả chuyển hóa thức ăn, giảm thể trọng và tăng trưởng, ức xấu, cổ chân bị tổn thương và dễ bị động vật ăn thịt tấn công.
Theo wellbeing-Quality® (2009), các biến số trên cho thấy mức độ phúc lợi kém của động vật. Do đó, việc theo dõi khả năng vận động di chuyển của một con gia cầm cho biết mức độ phúc lợi của chúng.
HỆ THỐNG PHÂN LOẠI TÌNH TRẠNG SỨC KHỎE
Wang và cộng sự (2019b) sử dụng màu sắc và độ nhớt của phân để chẩn đoán rối loạn tiêu hóa ở gà thịt.
Loại thức ăn cũng có thể ảnh hưởng đến màu sắc.
Lượng nước tiêu thụ cũng ảnh hưởng đến việc giảm độ nhớt phân.
Vì vậy, phương pháp này sẽ khó áp dụng với gà mái thả rông hoặc được cho ăn nhiều loại thức ăn khác nhau. Cần phải tiến hành thêm nghiên cứu để tạo ra một tập dữ liệu gia cầm với các đặc điểm cụ thể cho mỗi loại như gà thịt, gà đẻ, gà con, v.v., phù hợp để sử dụng trong hệ thống phát hiện gia cầm
Tuy nhiên, quá trình huấn luyện lại các ứng dụng mới sẽ tốn nhiều công sức. Do đó, nhiều nghiên cứu nên hướng đến các chiến lược học tập sáng tạo, như học tập bán giám sát và học tập thích ứng.
HỆ THỐNG THEO DÕI GIA CẦM
Việc đánh giá các yếu tố về biểu hiện hành vi (dạng hoạt động) và thể chất (tình trạng khập khiễng và sức khỏe) trong phúc lợi gia cầm phụ thuộc rất nhiều vào việc theo dõi gia cầm.
Việc phân tích kiểu hình hành vi và theo dõi phúc lợi đòi hỏi sự theo dõi và ghi lại liên tục sự vận động di chuyển và kiểu hình hành vi của gia cầm.
Zhuang và Zhang (2019) đã áp dụng phương pháp phát hiện đa đối tượng để phát hiện gà thịt không khỏe mạnh và kết quả nghiên cứu của họ đã thu hút được nhiều chú ý.
Hơn nữa, cần tiến hành thêm nghiên cứu về mạng học sâu (Deep learning-DL) sử dụng cảm biến dựa trên ánh sáng vô hình để giải quyết các vấn đề thay đổi độ sáng và cho phép theo dõi vào ban đêm (chế độ chiếu sáng).
TÍCH HỢP IOT VÀ DỮ LIỆU LỚN
Khi chúng ta xem xét việc tích hợp các thiết bị IoT với dữ liệu lớn, đây là thứ sẽ cách mạng hóa việc phân tích dự đoán trong chăn nuôi gia cầm bằng cách cung cấp cho người chăn nuôi thêm nhiều thông tin chi tiết hơn.
Bằng cách kết hợp các cảm biến, camera và IoT nói chung, các nền tảng dữ liệu lớn được sử dụng để phân tích nhiều biến số khác nhau, từ các yếu tố môi trường đến hành vi của từng cá thể gia cầm, sau đó đưa dữ liệu này vào một nền tảng để tương tác theo thời gian thực (Nakrosis và cộng sự, 2023).
Việc bổ sung chức năng AI không chỉ mở rộng phạm vi phân tích dữ liệu mà còn đẩy nhanh quá trình thực hiện phân tích, nâng cao hiệu quả và tính nhanh chóng của việc cân nhắc ra quyết định.
Chúng tôi hy vọng rằng độ chính xác và hiệu quả của các mô hình dự đoán sẽ tiếp tục tiến triển theo xu hướng này khi sự kết hợp phân tích sinh học, AI và máy học được cải thiện theo thời gian.
Các thuật toán tốt hơn, có khả năng xử lý các tập dữ liệu phức tạp nhanh hơn và hiệu quả hơn cũng đã bắt đầu xuất hiện.
Điều này sẽ cho phép chúng ta xác định các tín hiệu nhỏ hơn, hiếm hơn của các đợt dịch bệnh bùng phát sắp xảy ra trước khi biểu hiện bệnh lý xuất hiện đầy đủ, và có khả năng xác định các chủng bệnh mới khi chúng xuất hiện.
KẾT LUẬN
Mô hình dự đoán giúp khai thác dữ liệu lịch sử và dữ liệu thời gian thực để cung cấp cảnh báo sớm về các kết quả sức khỏe có thể xảy ra, từ đó ngăn ngừa dịch bệnh xảy ra.
Bằng cách chuyển từ các biện pháp quản lý bị động sang chủ động, chúng ta có thể tối ưu hóa phúc lợi vật nuôi và thu được lợi ích kinh tế đáng kể nhờ vào giảm tỷ lệ chết, giảm chi tiêu cho thuốc men hoặc đẩy nhanh quá trình theo dõi luân chuyển.
Việc sử dụng công nghệ AI và máy học đã nâng cao hơn nữa độ chính xác và tính kịp thời trong quá trình ra quyết định của các hệ thống dự đoán này.
Ngoài ra, việc giới thiệu các thiết bị IoT và phân tích dữ liệu lớn đã giúp phát triển dạng ứng dụng này hơn nữa bằng cách cung cấp thông tin chi tiết hơn và hỗ trợ giám sát.