شعار زيفيرنت

أنشئ نموذجًا للتعلم الآلي لتجزئة المحاصيل باستخدام بيانات Planet وإمكانات Amazon SageMaker الجغرافية المكانية | خدمات الويب الأمازون

التاريخ:

شارك في كتابة منشور الضيف هذا ليديا ليهوي تشانغ، أخصائية تطوير الأعمال، ومنسي شاه، مهندس برمجيات/عالم بيانات، في Planet Labs. ال التحليل الذي ألهم هذا المنصب كتبه في الأصل جينيفر ريبر كايل.

قدرات Amazon SageMaker الجغرافية المكانية جنبا إلى جنب مع كوكبيمكن استخدام بيانات الأقمار الصناعية لـ تجزئة المحاصيل، وهناك العديد من التطبيقات والفوائد المحتملة لهذا التحليل في مجالات الزراعة والاستدامة. في أواخر عام 2023، كوكب أعلن شراكة مع AWS لإتاحة بياناتها الجغرافية المكانية من خلال الأمازون SageMaker.

تجزئة المحاصيل هي عملية تقسيم صورة القمر الصناعي إلى مناطق من وحدات البكسل أو الأجزاء التي لها خصائص المحاصيل المماثلة. في هذا المنشور، نوضح كيفية استخدام نموذج التعلم الآلي (ML) لتحديد مناطق المحاصيل وغير المحاصيل في الصورة.

يعد تحديد مناطق المحاصيل خطوة أساسية نحو الحصول على رؤى زراعية، ويمكن أن يؤدي الجمع بين البيانات الجغرافية المكانية الغنية وتعلم الآلة إلى رؤى تدفع القرارات والإجراءات. على سبيل المثال:

  • اتخاذ قرارات زراعية تعتمد على البيانات - من خلال اكتساب فهم مكاني أفضل للمحاصيل، يمكن للمزارعين وغيرهم من أصحاب المصلحة الزراعيين تحسين استخدام الموارد، من المياه إلى الأسمدة إلى المواد الكيميائية الأخرى على مدار الموسم. وهذا يضع الأساس لتقليل النفايات، وتحسين ممارسات الزراعة المستدامة حيثما أمكن ذلك، وزيادة الإنتاجية مع تقليل التأثير البيئي.
  • تحديد الضغوط والاتجاهات المتعلقة بالمناخ – مع استمرار تغير المناخ في التأثير على درجات الحرارة العالمية وأنماط هطول الأمطار، يمكن استخدام تجزئة المحاصيل لتحديد المناطق المعرضة للضغوط المرتبطة بالمناخ من أجل استراتيجيات التكيف مع المناخ. على سبيل المثال، يمكن استخدام أرشيفات صور الأقمار الصناعية لتتبع التغيرات في منطقة زراعة المحاصيل مع مرور الوقت. قد تكون هذه هي التغيرات المادية في حجم وتوزيع الأراضي الزراعية. ويمكن أن تكون أيضًا التغيرات في رطوبة التربة، ودرجة حرارة التربة، والكتلة الحيوية، المستمدة من المؤشر الطيفي المختلف لبيانات الأقمار الصناعية، لإجراء تحليل أعمق لصحة المحاصيل.
  • تقييم وتخفيف الأضرار – وأخيرًا، يمكن استخدام تجزئة المحاصيل لتحديد مناطق تلف المحاصيل بسرعة ودقة في حالة وقوع كارثة طبيعية، مما يمكن أن يساعد في تحديد أولويات جهود الإغاثة. على سبيل المثال، بعد حدوث فيضان، يمكن استخدام صور الأقمار الصناعية ذات الإيقاع العالي لتحديد المناطق التي غمرت فيها المحاصيل أو دمرت، مما يسمح لمنظمات الإغاثة بمساعدة المزارعين المتضررين بسرعة أكبر.

في هذا التحليل، نستخدم نموذج الجيران الأقرب (KNN) لإجراء تجزئة المحاصيل، ونقارن هذه النتائج بصور الحقيقة الأرضية في منطقة زراعية. تكشف نتائجنا أن التصنيف من نموذج KNN يمثل بشكل أكثر دقة حالة حقل المحاصيل الحالي في عام 2017 مقارنة ببيانات تصنيف الحقيقة الأرضية من عام 2015. وتمثل هذه النتائج شهادة على قوة الصور الجغرافية المكانية عالية الإيقاع الخاصة بالكوكب. تتغير الحقول الزراعية في كثير من الأحيان، وأحيانًا عدة مرات في الموسم، كما أن توفر صور الأقمار الصناعية عالية التردد لمراقبة هذه الأرض وتحليلها يمكن أن يوفر قيمة هائلة لفهمنا للأراضي الزراعية والبيئات سريعة التغير.

شراكة Planet وAWS في تعلم الآلة الجغرافي المكاني

قدرات SageMaker الجغرافية المكانية تمكين علماء البيانات ومهندسي تعلم الآلة من بناء النماذج وتدريبها ونشرها باستخدام البيانات الجغرافية المكانية. تسمح لك إمكانات SageMaker الجغرافية المكانية بتحويل أو إثراء مجموعات البيانات الجغرافية المكانية واسعة النطاق بكفاءة، وتسريع بناء النماذج باستخدام نماذج تعلم الآلة المدربة مسبقًا، واستكشاف تنبؤات النماذج والبيانات الجغرافية المكانية على خريطة تفاعلية باستخدام الرسومات المسرَّعة ثلاثية الأبعاد وأدوات التصور المدمجة. باستخدام إمكانات SageMaker الجغرافية المكانية، يمكنك معالجة مجموعات بيانات كبيرة من صور الأقمار الصناعية والبيانات الجغرافية المكانية الأخرى لإنشاء نماذج تعلم الآلة دقيقة لمختلف التطبيقات، بما في ذلك تجزئة المحاصيل، والتي نناقشها في هذا المنشور.

بلانيت لابز بي بي سي هي شركة رائدة في مجال تصوير الأرض وتستخدم أسطولها الكبير من الأقمار الصناعية لالتقاط صور لسطح الأرض بشكل يومي. وبالتالي، تعد بيانات الكوكب مصدرًا قيمًا لتعلم الآلة الجغرافي المكاني. ويمكن استخدام صور الأقمار الصناعية عالية الدقة لتحديد خصائص المحاصيل المختلفة وصحتها مع مرور الوقت، وفي أي مكان على الأرض.

تتيح الشراكة بين Planet وSageMaker للعملاء إمكانية الوصول بسهولة إلى بيانات الأقمار الصناعية عالية التردد الخاصة بـ Planet وتحليلها باستخدام أدوات تعلم الآلة القوية من AWS. يمكن لعلماء البيانات إحضار بياناتهم الخاصة أو العثور على بيانات Planet والاشتراك فيها بسهولة دون تبديل البيئات.

تجزئة المحاصيل في دفتر ملاحظات Amazon SageMaker Studio مع صورة جغرافية مكانية

في هذا المثال لسير عمل تعلم الآلة الجغرافي المكاني، ننظر في كيفية جلب بيانات Planet جنبًا إلى جنب مع مصدر بيانات الحقيقة الأرضية إلى SageMaker، وكيفية تدريب نموذج تجزئة المحاصيل واستنتاجه ونشره باستخدام مصنف KNN. وأخيرًا، نقوم بتقييم دقة نتائجنا ومقارنتها بتصنيفنا للحقيقة الأرضية.

تم تدريب مصنف KNN المستخدم في دفتر ملاحظات Amazon SageMaker Studio مزود بجغرافية مكانية الصورة، ويوفر نواة دفتر ملاحظات مرنة وقابلة للتوسيع للعمل مع البيانات الجغرافية المكانية.

أمازون ساجميكر ستوديو يأتي دفتر الملاحظات الذي يحتوي على صورة جغرافية مكانية مثبتًا مسبقًا مع مكتبات جغرافية مكانية شائعة الاستخدام مثل GDAL، وFiona، وGeoPandas، وShapely، وRasterio، والتي تسمح بتصور البيانات الجغرافية المكانية ومعالجتها مباشرة داخل بيئة دفتر ملاحظات Python. تُستخدم أيضًا مكتبات ML الشائعة مثل OpenCV أو scikit-learn لإجراء تجزئة المحاصيل باستخدام تصنيف KNN، ويتم تثبيتها أيضًا في النواة الجغرافية المكانية.

اختيار البيانات

يقع الحقل الزراعي الذي نقوم بتكبيره في مقاطعة ساكرامنتو المشمسة عادة في كاليفورنيا.

لماذا سكرامنتو؟ يتم تحديد اختيار المنطقة والوقت لهذا النوع من المشاكل في المقام الأول من خلال توفر بيانات الحقيقة الأرضية، وليس من السهل الحصول على مثل هذه البيانات في نوع المحاصيل وبيانات الحدود. ال مجموعة بيانات مسح DWR لاستخدام الأراضي في مقاطعة ساكرامنتو لعام 2015 هي مجموعة بيانات متاحة للجمهور تغطي مقاطعة ساكرامنتو في ذلك العام وتوفر حدودًا تم تعديلها يدويًا.

صور القمر الصناعي الأساسية التي نستخدمها هي النطاق الرابع للكوكب منتج بي إس إسسين، الذي يحتوي على نطاقات الأزرق والأخضر والأحمر والأشعة تحت الحمراء القريبة ويتم تصحيحه إشعاعيًا وفقًا لإشعاع المستشعر. يتم توفير معاملات تصحيح الانعكاس عند المستشعر في البيانات الوصفية للمشهد، مما يؤدي إلى تحسين الاتساق بين الصور الملتقطة في أوقات مختلفة.

تم إطلاق أقمار Planet's Dove الصناعية التي أنتجت هذه الصور في 14 فبراير 2017 (اصدار جديد)، لذلك لم يلتقطوا صورة لمقاطعة ساكرامنتو في عام 2015. ومع ذلك، فقد أخذوا صورًا يومية للمنطقة منذ الإطلاق. في هذا المثال، قمنا بتسوية الفجوة غير الكاملة البالغة عامين بين بيانات الحقيقة الأرضية وصور الأقمار الصناعية. ومع ذلك، كان من الممكن استخدام صور Landsat 2 ذات الدقة المنخفضة كجسر بين عامي 8 و2015.

الوصول إلى بيانات الكوكب

ولمساعدة المستخدمين في الحصول على بيانات دقيقة وقابلة للتنفيذ بشكل أسرع، قامت Planet أيضًا بتطوير Planet Software Development Kit (SDK) لـ Python. هذه أداة قوية لعلماء البيانات والمطورين الذين يرغبون في العمل مع صور الأقمار الصناعية والبيانات الجغرافية المكانية الأخرى. باستخدام مجموعة SDK هذه، يمكنك البحث والوصول إلى مجموعة Planet الواسعة من صور الأقمار الصناعية عالية الدقة، بالإضافة إلى البيانات من مصادر أخرى مثل OpenStreetMap. يوفر SDK عميل Python لواجهات برمجة التطبيقات الخاصة بـ Planet، بالإضافة إلى حل واجهة سطر الأوامر بدون رمز (CLI)، مما يجعل من السهل دمج صور الأقمار الصناعية والبيانات الجغرافية المكانية في سير عمل Python. يستخدم هذا المثال عميل Python لتحديد وتنزيل الصور اللازمة للتحليل.

يمكنك تثبيت عميل Planet Python في دفتر ملاحظات SageMaker Studio مع صورة جغرافية مكانية باستخدام أمر بسيط:

%pip install planet

يمكنك استخدام العميل للاستعلام عن صور القمر الصناعي ذات الصلة واسترداد قائمة النتائج المتاحة بناءً على مجال الاهتمام والنطاق الزمني ومعايير البحث الأخرى. في المثال التالي، نبدأ بالسؤال عن العدد مشاهد PlanetScope (الصور اليومية للكوكب) تغطي نفس منطقة الاهتمام (AOI) التي حددناها سابقًا من خلال البيانات الأرضية في سكرامنتو، مع مراعاة نطاق زمني معين بين 1 يونيو و1 أكتوبر 2017؛ بالإضافة إلى نطاق التغطية السحابية الأقصى المطلوب بنسبة 10%:

# create a request using the SDK from the search specifications of the data item_type = ['PSScene'] geom_filter_train = data_filter.geometry_filter(aoi_train)
date_range_filter = data_filter.date_range_filter("acquired", gt=datetime(month=6, day=1, year=2017), lt=datetime(month=10, day=1, year=2017))
cloud_cover_filter = data_filter.range_filter('cloud_cover', lt=0.10) combined_filter_test = data_filter.and_filter([geom_filter_test, date_range_filter, cloud_cover_filter]) # Run a quick search for our TRAIN data
async with Session() as sess: cl = sess.client('data') results = cl.search(name='temp_search_train',search_filter=combined_filter_train, item_types=item_type) train_result_list = [i async for i in results] print("Number of train scene results: ", len(train_result_list))

تُظهر النتائج التي تم إرجاعها عدد المشاهد المطابقة المتداخلة مع مجال اهتمامنا. ويحتوي أيضًا على البيانات الوصفية لكل مشهد ومعرف الصورة الخاص به ومرجع صورة المعاينة.

بعد تحديد مشهد معين، مع تحديد معرف المشهد ونوع العنصر وحزم المنتج (مرجع الوثائق)، يمكنك استخدام الكود التالي لتنزيل الصورة وبياناتها الوصفية:

train_scene_id = '20170601_180425_0f35'
item_type = 'PSScene'
bundle_type = 'analytic_sr_udm2' # define the order request
products = [order_request.product([train_scene_id], bundle_type, item_type)]
request = order_request.build_request('train_dataset', products=products) # download the training data
async with Session() as sess: cl = sess.client('orders') # use "reporting" to manage polling for order status with reporting.StateBar(state='creating') as bar: # perform the order with the prior created order request order = await cl.create_order(request) bar.update(state='created', order_id=train_order['id']) # wait via polling until the order is processed await cl.wait(train_order['id'], callback=bar.update_state) # download the actual asset await cl.download_order(order_id=order['id'], directory=download_directory, progress_bar=True, overwrite=True)

يقوم هذا الرمز بتنزيل صورة القمر الصناعي المقابلة إلى ملف نظام ملفات أمازون المرن وحدة تخزين (Amazon EFS) لـ SageMaker Studio.

تدريب نموذجي

بعد تنزيل البيانات باستخدام عميل Planet Python، يمكن تدريب نموذج التجزئة. في هذا المثال، يتم استخدام مجموعة من تقنيات تصنيف KNN وتجزئة الصورة لتحديد مساحة الاقتصاص وإنشاء ميزات Geojson ذات مرجع جغرافي.

يتم تحميل بيانات Planet ومعالجتها مسبقًا باستخدام المكتبات والأدوات الجغرافية المكانية المضمنة في SageMaker لإعدادها لتدريب مصنف KNN. البيانات الحقيقة الأساسية للتدريب هي مجموعة بيانات مسح DWR لاستخدام الأراضي في مقاطعة ساكرامنتو من عام 2015، ويتم استخدام بيانات Planet من عام 2017 لاختبار النموذج.

تحويل ميزات الحقيقة الأرضية إلى معالم

لتدريب مصنف KNN، فئة كل بكسل إما crop or non-crop يحتاج إلى تحديد. يتم تحديد الفئة من خلال ما إذا كان البكسل مرتبطًا بميزة الاقتصاص في بيانات الحقيقة الأساسية أم لا. لإجراء هذا التحديد، يتم أولاً تحويل بيانات الحقيقة الأساسية إلى خطوط OpenCV، والتي يتم استخدامها بعد ذلك للفصل crop تبدأ من non-crop بكسل. يتم بعد ذلك استخدام قيم البكسل وتصنيفها لتدريب مصنف KNN.

لتحويل معالم الحقيقة الأرضية إلى معالم، يجب أولاً إسقاط المعالم على النظام المرجعي الإحداثي للصورة. بعد ذلك، يتم تحويل المعالم إلى مساحة صورة، وفي النهاية يتم تحويلها إلى خطوط محيطية. لضمان دقة الخطوط، يتم تصورها متراكبة على الصورة المدخلة، كما هو موضح في المثال التالي.

لتدريب مصنف KNN، يتم فصل وحدات البكسل المقتصة وغير المقتصة باستخدام ملامح ميزة الاقتصاص كقناع.

يتكون مدخل مصنف KNN من مجموعتي بيانات: X، وهي مصفوفة ثنائية الأبعاد توفر الميزات التي سيتم التصنيف عليها؛ وy، مصفوفة 2d توفر الفئات (مثال). هنا، يتم إنشاء نطاق مصنف واحد من مجموعات البيانات غير المحصولية والمحصولية، حيث تشير قيم النطاق إلى فئة البكسل. يتم بعد ذلك تحويل النطاق وقيم نطاق بكسل الصورة الأساسية إلى مدخلات X وy لوظيفة ملاءمة المصنف.

قم بتدريب المصنف على وحدات البكسل المقتصة وغير المقتطعة

يتم تنفيذ تصنيف KNN باستخدام scikit-Learn KNeighborsClassifier. يتم ضبط عدد الجيران، وهو معلمة تؤثر بشكل كبير على أداء المقدر، باستخدام التحقق من الصحة في التحقق من صحة KNN. يتم بعد ذلك تدريب المصنف باستخدام مجموعات البيانات المعدة والعدد المضبوط من معلمات الجوار. انظر الكود التالي:

def fit_classifier(pl_filename, ground_truth_filename, metadata_filename, n_neighbors): weights = 'uniform' clf = neighbors.KNeighborsClassifier(n_neighbors, weights=weights) train_class_band = create_contour_classified_band(pl_filename, ground_truth_filename) X = to_X(load_refl_bands(pl_filename, metadata_filename)) y = to_y(train_class_band) clf.fit(X, y) return clf clf = fit_classifier(train_scene_filename, train_ground_truth_filename, train_metadata_filename, n_neighbors)

لتقييم أداء المصنف على بيانات الإدخال الخاصة به، يتم التنبؤ بفئة البكسل باستخدام قيم نطاق البكسل. يعتمد أداء المصنف بشكل أساسي على دقة بيانات التدريب والفصل الواضح لفئات البكسل بناءً على بيانات الإدخال (قيم نطاق البكسل). يمكن تعديل معلمات المصنف، مثل عدد الجيران ووظيفة وزن المسافة، للتعويض عن أي أخطاء في الأخيرة. انظر الكود التالي:

def predict(pl_filename, metadata_filename, clf): bands = load_refl_bands(pl_filename, metadata_filename) X = to_X(bands) y = clf.predict(X) return classified_band_from_y(bands[0].mask, y) train_predicted_class_band = predict(train_scene_filename, train_metadata_filename, clf)

تقييم تنبؤات النموذج

يتم استخدام مصنف KNN المدرب للتنبؤ بمناطق المحاصيل في بيانات الاختبار. تتكون بيانات الاختبار هذه من المناطق التي لم تتعرض للنموذج أثناء التدريب. بمعنى آخر، ليس لدى النموذج أي معرفة بالمنطقة قبل تحليله، وبالتالي يمكن استخدام هذه البيانات لتقييم أداء النموذج بشكل موضوعي. نبدأ بالفحص البصري لعدة مناطق، بدءًا بمنطقة أكثر ضجيجًا نسبيًا.

يكشف الفحص البصري أن الفئات المتوقعة تتوافق في الغالب مع فئات الحقيقة الأرضية. هناك مناطق قليلة من الانحراف، والتي سنفحصها بشكل أكبر.

بعد مزيد من التحقيق، اكتشفنا أن بعض الضوضاء في هذه المنطقة كانت بسبب افتقار بيانات الحقيقة الأرضية إلى التفاصيل الموجودة في الصورة المصنفة (أعلى اليمين مقارنة بأعلى اليسار وأسفل اليسار). ومن النتائج المثيرة للاهتمام بشكل خاص أن المصنف يحدد الأشجار على طول النهر على أنها non-crop، في حين أن بيانات الحقيقة الأرضية تحددها عن طريق الخطأ على أنها crop. قد يكون هذا الاختلاف بين هذين الجزأين بسبب تظليل الأشجار للمنطقة فوق المحاصيل.

بعد ذلك، نستعرض منطقة أخرى تم تصنيفها بشكل مختلف بين الطريقتين. تم تحديد هذه المناطق المميزة سابقًا على أنها مناطق غير محاصيل في بيانات الحقيقة الأرضية في عام 2015 (أعلى اليمين) ولكنها تغيرت وأظهرت بوضوح كأراضي زراعية في عام 2017 من خلال مشاهد Planetscope (أعلى اليسار وأسفل اليسار). كما تم تصنيفها أيضًا إلى حد كبير على أنها أراضي زراعية من خلال المصنف (أسفل اليمين).

مرة أخرى، نرى أن مصنف KNN يقدم نتيجة أكثر تفصيلاً من فئة الحقيقة الأرضية، كما أنه يلتقط بنجاح التغيير الذي يحدث في الأراضي الزراعية. يتحدث هذا المثال أيضًا عن قيمة بيانات الأقمار الصناعية المحدثة يوميًا لأن العالم غالبًا ما يتغير بشكل أسرع بكثير من التقارير السنوية، ويمكن أن تساعدنا الطريقة المدمجة مع تعلم الآلة مثل هذه في التقاط التغييرات فور حدوثها. إن القدرة على مراقبة واكتشاف مثل هذه التغييرات عبر بيانات الأقمار الصناعية، خاصة في المجالات الزراعية المتطورة، توفر رؤى مفيدة للمزارعين لتحسين عملهم ولأي صاحب مصلحة زراعي في سلسلة القيمة للحصول على نبض أفضل لهذا الموسم.

تقييم النموذج

يمكن أن تكون المقارنة المرئية لصور الفئات المتوقعة مع فئات الحقيقة الأرضية ذاتية ولا يمكن تعميمها لتقييم دقة نتائج التصنيف. للحصول على تقييم كمي، نحصل على مقاييس التصنيف باستخدام scikit-learn classification_report وظيفة:

# train dataset
print(classification_report(to_y(create_contour_classified_band(train_scene_filename, train_ground_truth_filename)), to_y(train_predicted_class_band), target_names=['crop', 'non-crop'])) precision recall f1-score support crop 0.89 0.86 0.87 2641818 non-crop 0.83 0.86 0.84 2093907 accuracy 0.86 4735725 macro avg 0.86 0.86 0.86 4735725
weighted avg 0.86 0.86 0.86 4735725 # test dataset
print(classification_report(to_y(create_contour_classified_band(test_scene_filename, test_ground_truth_filename)), to_y(test_predicted_class_band), target_names=['crop', 'non-crop'])) precision recall f1-score support crop 0.94 0.73 0.82 1959630 non-crop 0.32 0.74 0.44 330938 accuracy 0.73 2290568 macro avg 0.63 0.74 0.63 2290568
weighted avg 0.85 0.73 0.77 2290568

يتم استخدام تصنيف البكسل لإنشاء قناع تجزئة لمناطق المحاصيل، مما يجعل الدقة واستدعاء المقاييس المهمة، وتعتبر درجة F1 مقياسًا عامًا جيدًا للتنبؤ بالدقة. تعطينا نتائجنا مقاييس لكل من مناطق المحاصيل وغير المحاصيل في مجموعة بيانات التدريب والاختبار. ومع ذلك، لتبسيط الأمور، دعونا نلقي نظرة فاحصة على هذه المقاييس في سياق مناطق المحاصيل في مجموعة بيانات الاختبار.

الدقة هي مقياس لمدى دقة التوقعات الإيجابية لنموذجنا. في هذه الحالة، تشير دقة 0.94 لمناطق المحاصيل إلى أن نموذجنا ناجح جدًا في تحديد المناطق التي هي بالفعل مناطق محاصيل بشكل صحيح، حيث يتم تقليل الإيجابيات الكاذبة (المناطق غير المحصولية الفعلية التي تم تحديدها بشكل غير صحيح كمناطق محاصيل). من ناحية أخرى، يقيس التذكير مدى اكتمال التنبؤات الإيجابية. بمعنى آخر، يقيس الاستدعاء نسبة الإيجابيات الفعلية التي تم تحديدها بشكل صحيح. في حالتنا، تعني قيمة الاستدعاء البالغة 0.73 لمناطق الاقتصاص أنه تم تحديد 73% من جميع وحدات بكسل منطقة الاقتصاص الحقيقية بشكل صحيح، مما يقلل عدد السلبيات الكاذبة.

ومن الناحية المثالية، يفضل القيم العالية لكل من الدقة والتذكر، على الرغم من أن هذا يمكن أن يعتمد إلى حد كبير على تطبيق دراسة الحالة. على سبيل المثال، إذا كنا نفحص هذه النتائج للمزارعين الذين يتطلعون إلى تحديد مناطق المحاصيل للزراعة، فإننا نرغب في إعطاء الأفضلية لاستدعاء أعلى من الدقة، وذلك من أجل تقليل عدد السلبيات الكاذبة (المناطق التي تم تحديدها على أنها مناطق غير محصولية والتي هي في الواقع مناطق محاصيل) من أجل تحقيق أقصى استفادة من الأرض. تعمل درجة F1 كمقياس دقة شامل يجمع بين الدقة والاستدعاء، وقياس التوازن بين المقياسين. تشير درجة F1 العالية، مثل درجتنا الخاصة بمناطق المحاصيل (0.82)، إلى وجود توازن جيد بين الدقة والاستدعاء ودقة التصنيف الشاملة العالية. على الرغم من انخفاض درجة F1 بين مجموعات بيانات القطار والاختبار، إلا أن هذا متوقع لأنه تم تدريب المصنف على مجموعة بيانات القطار. يعد المتوسط ​​​​المرجح الإجمالي لدرجة F1 البالغ 0.77 واعدًا وكافيًا بدرجة كافية لتجربة مخططات التجزئة على البيانات المصنفة.

إنشاء قناع تجزئة من المصنف

يتضمن إنشاء قناع التجزئة باستخدام التنبؤات من مصنف KNN في مجموعة بيانات الاختبار تنظيف المخرجات المتوقعة لتجنب المقاطع الصغيرة الناتجة عن ضوضاء الصورة. لإزالة ضوضاء البقع، نستخدم OpenCV مرشح طمس متوسط. يحافظ هذا المرشح على حدود الطريق بين المحاصيل بشكل أفضل من العملية المورفولوجية المفتوحة.

لتطبيق التجزئة الثنائية على المخرجات قليلة الضوضاء، نحتاج أولاً إلى تحويل البيانات النقطية المصنفة إلى ميزات متجهة باستخدام OpenCV تجدون وظيفة.

وأخيرا، يمكن حساب مناطق المحاصيل المجزأة الفعلية باستخدام الخطوط العريضة للمحاصيل المجزأة.

تسمح مناطق المحاصيل المجزأة المنتجة من مصنف KNN بالتحديد الدقيق لمناطق المحاصيل في مجموعة بيانات الاختبار. ويمكن استخدام هذه المناطق المجزأة لأغراض مختلفة، مثل تحديد حدود الحقل، ومراقبة المحاصيل، وتقدير الغلة، وتخصيص الموارد. تعتبر درجة F1 التي تم تحقيقها والتي تبلغ 0.77 جيدة وتوفر دليلاً على أن مصنف KNN هو أداة فعالة لتجزئة المحاصيل في صور الاستشعار عن بعد. ويمكن استخدام هذه النتائج لزيادة تحسين وصقل تقنيات تجزئة المحاصيل، مما قد يؤدي إلى زيادة الدقة والكفاءة في تحليل المحاصيل.

وفي الختام

أوضح هذا المنشور كيف يمكنك استخدام مجموعة من الكوكب إيقاع عالي، وصور الأقمار الصناعية عالية الدقة و قدرات SageMaker الجغرافية المكانية لإجراء تحليل تجزئة المحاصيل، وفتح رؤى قيمة يمكن أن تحسن الكفاءة الزراعية، والاستدامة البيئية، والأمن الغذائي. يتيح التحديد الدقيق لمناطق المحاصيل إجراء مزيد من التحليل حول نمو المحاصيل وإنتاجيتها، ومراقبة التغيرات في استخدام الأراضي، والكشف عن المخاطر المحتملة على الأمن الغذائي.

علاوة على ذلك، يوفر الجمع بين Planet data وSageMaker نطاقًا واسعًا من حالات الاستخدام بما يتجاوز تجزئة المحاصيل. يمكن للرؤى تمكين اتخاذ القرارات المستندة إلى البيانات بشأن إدارة المحاصيل وتخصيص الموارد وتخطيط السياسات في الزراعة وحدها. ومن خلال نماذج البيانات وتعلم الآلة المختلفة، يمكن للعرض المشترك أيضًا التوسع في صناعات أخرى واستخدام الحالات نحو التحول الرقمي والتحول المستدام والأمن.

لبدء استخدام إمكانيات SageMaker الجغرافية المكانية، راجع ابدأ باستخدام إمكانيات Amazon SageMaker الجغرافية المكانية.

لمعرفة المزيد حول مواصفات صور Planet والمواد المرجعية للمطورين، تفضل بزيارة مركز كوكب المطورين. للحصول على وثائق حول Planet's SDK لـ Python، راجع Planet SDK لبيثون. لمزيد من المعلومات حول Planet، بما في ذلك منتجات البيانات الحالية وإصدارات المنتجات القادمة، تفضل بزيارة https://www.planet.com/.

بيانات تطلعية من Planet Labs PBC

باستثناء المعلومات التاريخية الواردة هنا، فإن المسائل المنصوص عليها في منشور المدونة هذا هي بيانات تطلعية بالمعنى المقصود في أحكام "الملاذ الآمن" في قانون إصلاح التقاضي للأوراق المالية الخاصة لعام 1995، بما في ذلك، على سبيل المثال لا الحصر، Planet Labs. قدرة PBC على اغتنام فرص السوق وتحقيق أي من الفوائد المحتملة من تحسينات المنتج الحالية أو المستقبلية أو المنتجات الجديدة أو الشراكات الإستراتيجية وتعاون العملاء. تعتمد البيانات التطلعية على معتقدات إدارة Planet Labs PBC، بالإضافة إلى الافتراضات التي قدمتها والمعلومات المتاحة لها حاليًا. ونظرًا لأن هذه البيانات تستند إلى توقعات بشأن الأحداث والنتائج المستقبلية وليست بيانات حقائق، فقد تختلف النتائج الفعلية ماديًا عن تلك المتوقعة. تشمل العوامل التي قد تتسبب في اختلاف النتائج الفعلية ماديًا عن التوقعات الحالية، على سبيل المثال لا الحصر، عوامل الخطر والإفصاحات الأخرى حول Planet Labs PBC وأعمالها المدرجة في التقارير الدورية لـ Planet Labs PBC وبيانات الوكيل ومواد الإفصاح الأخرى المقدمة من الوقت. مع هيئة الأوراق المالية والبورصة (SEC) المتوفرة عبر الإنترنت على www.sec.govوعلى الموقع الإلكتروني لشركة Planet Labs PBC على www.planet.com. تعكس جميع البيانات التطلعية معتقدات وافتراضات Planet Labs PBC فقط اعتبارًا من تاريخ الإدلاء بهذه البيانات. لا تتحمل شركة Planet Labs PBC أي التزام بتحديث البيانات التطلعية لتعكس الأحداث أو الظروف المستقبلية.


عن المؤلفين

ليديا ليهوي تشانغ هي أخصائية تطوير الأعمال في Planet Labs PBC، حيث تساعد في ربط الفضاء لتحسين الأرض عبر مختلف القطاعات وعدد لا يحصى من حالات الاستخدام. في السابق، كانت عالمة بيانات في McKinsey ACRE، وهو حل يركز على الزراعة. وهي حاصلة على درجة الماجستير في العلوم من برنامج سياسات التكنولوجيا في معهد ماساتشوستس للتكنولوجيا، مع التركيز على سياسة الفضاء. لقد كانت البيانات الجغرافية المكانية وتأثيرها الأوسع على الأعمال والاستدامة هي محور اهتمامها المهني.

منسي شاه هو مهندس برمجيات، وعالم بيانات، وموسيقي يستكشف عمله المساحات التي تتصادم فيها الصرامة الفنية والفضول التقني. إنها تعتقد أن البيانات (مثل الفن!) تحاكي الحياة، وتهتم بالقصص الإنسانية العميقة وراء الأرقام والملاحظات.

شيونغ تشو هو أحد كبار العلماء التطبيقيين في AWS. وهو يقود الفريق العلمي لقدرات Amazon SageMaker الجغرافية المكانية. يتضمن مجال بحثه الحالي رؤية الكمبيوتر والتدريب النموذجي الفعال. يستمتع في أوقات فراغه بالجري ولعب كرة السلة وقضاء الوقت مع عائلته.

يانوش فوشيتز هو أحد كبار مهندسي الحلول في AWS، وهو متخصص في الذكاء الاصطناعي/تعلم الآلة الجغرافي المكاني. ومع أكثر من 15 عامًا من الخبرة، فهو يدعم العملاء على مستوى العالم في الاستفادة من الذكاء الاصطناعي والتعلم الآلي للحلول المبتكرة التي تستفيد من البيانات الجغرافية المكانية. تشمل خبرته التعلم الآلي، وهندسة البيانات، والأنظمة الموزعة القابلة للتطوير، مدعومة بخلفية قوية في هندسة البرمجيات والخبرة الصناعية في المجالات المعقدة مثل القيادة الذاتية.

شيتال داكال هو مدير برنامج أول في فريق SageMaker Geospatial ML ومقره في منطقة خليج سان فرانسيسكو. لديه خلفية في الاستشعار عن بعد ونظم المعلومات الجغرافية (GIS). إنه متحمس لفهم نقاط الضعف لدى العملاء وبناء المنتجات الجغرافية المكانية لحلها. يستمتع في أوقات فراغه بالمشي لمسافات طويلة والسفر ولعب التنس.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة