Abstract
Road networks and transportation infrastructure play a crucial role in many applications such as urban planning and environmental assessment. Remote sensing provides multispectral data that can be used to identify, extract, and map roads. However, accurate mapping of road networks from aerial imagery poses challenges due to the complexity of real-world road patterns. The aim of this study was to develop deep learning techniques for automated road extraction from aerial photographs. The study evaluated several convolutional neural network (CNN) architectures were including a hybrid spectral-spatial network (HybridSN). Models were assessed on a dataset of urban aerial images with lidar-derived ground truth labels. The joint modeling of multi-modal cues enables highly precise localization and delineation of road segments. The results of the HybridSN integrating both spectral and spatial processing achieved the top performance with 96.9% overall accuracy and 80.6% intersection-over-union after post-processing. In comparison, CNNs leveraging spatial context alone perform worse with the best overall accuracy of 95.4% after post-processing. The findings demonstrate the importance of fusing spectral and spatial data within deep learning frameworks for road extraction.
Keywords
CNN
deep learning
Old Mosul City.
Road detection
Road infrastructure
Abstract
يعد رسم خرائط دقيقة للبنية التحتية للطرق من الصور الجوية أمرًا بالغ الأهمية لمختلف التطبيقات ولكنه يطرح تحديات عديدة بسبب تعقيد أنماط الطرق في الواقع الحقيقي. يبحث هذا البحث في تقنيات التعلم العميق لاستخراج الطرق بشكل الي من البيانات العامة. يتم تقييم العديد من بنى الشبكات العصبية التلافيفية (CNN) بما في ذلك الشبكة الطيفية المكانية الهجينة (HybridSN) التي تجمع بين للصور البصرية وبيانات الليدار. يتم تقييم النماذج على مجموعة بيانات من الصور الجوية الحضرية باستخدام علامات حقيقة أرضية مشتقة من تقنية الليدار. ويحقق HybridSN الذي يدمج كلاً من المعالجة الطيفية والمكانية أعلى أداء بدقة إجمالية تبلغ 96.9% و80.6% من التقاطع بعد المعالجة اللاحقة. تتيح النمذجة المشتركة للإشارات متعددة الوسائط إمكانية تحديد أجزاء الطريق وتحديدها بدقة عالية. وبالمقارنة، فإن شبكات CNN التي تستفيد من السياق المكاني وحده تؤدي أداءً أسوأ مع أفضل دقة إجمالية تبلغ 95.4% بعد المعالجة اللاحقة. تظهر جميع النماذج أوجه قصور في استخراج شبكات الطرق المتماسكة. وهذا يدل على أهمية دمج البيانات الطيفية والمكانية ضمن أطر التعلم العميق لاستخراج الطرق. تسلط النتائج الضوء على الفرص المتاحة لتطوير أحدث الخرائط من خلال أجهزة الاستشعار الهجينة وتصميم بنى عصبية ذات وعي طوبولوجي أقوى. يقوم بالتحليل الآلي للبيانات الجوية متعددة الوسائط مع التعلم العميق والحفاظ على كفاءة قوائم جرد حديثة للبنية التحتية الحيوية للنقل على نطاق المدن.
Keywords
CNN، التعلم العميق، كشف الطرق، البنية التحتية للطرق، مدينة الموصل القديمة.