عصر دادهها در معدن
محمد فهیمینیا-دکترای اکتشاف معدن و عضو کارگروه هوش مصنوعی موسسه یونیدرو
امروزه اکتشاف معدن وارد عصر دادههای عظیم شده و ترکیب علوم زمین با علوم داده تحول بزرگی در این حوزه ایجاد کرده است. فرآیندهای اکتشافی منابع معدنی شامل گردآوری انبوهی از دادههای زمینشناسی، ژئوشیمیایی، ژئوفیزیک، تصاویر ماهوارهای و گزارشهای متنی است که تحلیل آنها از توان روشهای سنتی فراتر رفته است. هوش مصنوعی و یادگیری ماشین بهعنوان راهکاری برای مواجهه با این چالش پدیدار شدهاند. بهکارگیری الگوریتمهای پیشرفته دادهمحور میتواند به بهبود دقت نقشهبرداری پتانسیل معدنی و کاهش آثار زیستمحیطی عملیات اکتشافی کمک کند.
به بیان دیگر، روشهای یادگیری ماشین اکنون در خدمت اکتشاف و نقشهبرداری منابع معدنی قرار گرفتهاند تا با افزایش دقت، نیاز به حفاریهای پراکنده و پرهزینه را کاهش دهند. این تحول دیجیتال در صنعت معدن، نویدبخش افزایش چشمگیر بهرهوری و سرعت در شناسایی ذخایر جدید است. با این حال، دادههای علوم زمین ذاتا پیچیده، ناهمگون و چندمقیاسی هستند. چالشهایی نظیر ناکافیبودن دادههای برچسبخورده، تفاوت شرایط زمینشناسی مناطق مختلف و نیاز به تفسیر قابل اعتماد خروجی مدلها، هنوز پابرجاست. برای غلبه بر این مشکلات، نسل جدیدی از مدلهای هوش مصنوعی با عنوان مدلهای بنیادین (Foundation Models) معرفی شدهاند.
پیوند علوم زمین دادهمحور با اکتشاف معدن
اکتشاف منابع معدنی ذاتا یک فعالیت میانرشتهای است که علوم زمین و مهندسی معدن را با علوم داده و فناوری اطلاعات پیوند میدهد. دادههای اکتشافی شامل انواع مختلفی هستند: از دادههای کمّی اندازهگیریشده در آزمایشگاههای ژئوشیمی گرفته تا دادههایبرداری و تصویری در ژئوفیزیک و سنجش از دور و همچنین مشاهدات کیفی و توصیفی زمینشناسان در گزارشها و لاگهای حفاری. ترکیب و تفسیر این دادههای چندمنظوره برای شناسایی مناطق امیدبخش معدنی اهمیت حیاتی دارد. مدلهای زبانی زمینشناسی تخصصی: یکی از پیشرفتهای برجسته، توسعه مدلهای زبانی عظیم مختص علوم زمین بوده است. برای مثال، در سال۲۰۲۳ مدلی به نام GeoGalactica معرفی شد که یک LLM با ۳۰میلیارد پارامتر ویژه حوزه ژئوساینس است. این مدل با پردازش ۶۵میلیارد کلمه از متون علمی زمینشناسی و همچنین روی مجموعهای از پرسشوپاسخهای تخصصی آموزش دیده است. GeoGalactica بهعنوان بزرگترین مدل زبانی زمینشناسی تاکنون شناخته میشود و بهصورت متنباز در اختیار محققان قرار گرفته است. آزمایشها نشان داده که این مدل در پاسخگویی به سوالات دشوار زمینشناسی و انجام وظایف مختلف پردازش زبان مانند استخراج دانش و طبقهبندی اسناد بهتر از مدلهای عمومی عمل میکند.
همچنین پژوهش دیگری در سال۲۰۲۴ توسط Pyo و Chiang معرفی شد که رویکردی خلاقانه برای پیونددهی خودکار سوابق معدنی ارائه میداد. در این روش، ابتدا یک مدل زبانی بزرگ (LLaMA) حجم زیادی از دادههای خام مربوط به مکانهای معدنی را برچسبگذاری میکند و ارتباط بین رکوردهای پراکنده (با نامهای متفاوت یا مختصات مبهم) را مانند یک کارشناس باتجربه تشخیص میدهد. سپس از این دادههای برچسبخورده برای آموزش یک مدل کوچکتر و سریعتر استفاده میشود تا بتوان تعداد عظیمی از رکوردها را بهصورت خودکار لینک کرد.
نتیجه کار بسیار موفقیتآمیز بود. این سامانه ترکیبی دقت اتصال دادهها را ۴۵درصد بیشتر از روشهای سنتی اعلام کرد و در عین حال بسیار سریعتر از استفاده مستقیم از یک LLM عظیم عمل کرد. به عبارتی، این رویکرد توانست سرعتبخشی به یکپارچهسازی دادههای قدیمی و جدید اکتشاف را محقق کند. برای مثال، در عمل یک شرکت معدن میتواند هزاران گزارش حفاری قدیمی را با دادههای نقشهبرداری جدید مرتبط کند و تصویر کاملتری از پتانسیل معدنی منطقه بهدست آورد.
ترکیب مدلهای زبانی با دادههای مکانی: پروژه GeoMap-Bench و GeoMap-Agent (سال ۲۰۲۵) که با همکاری Microsoft Research Asia و آکادمی علوم زمین چین انجام شد، مثال خوبی از تلاش پژوهشی برای ارزیابی و ارتقای درک نقشههای زمینشناسی توسط AI است. آنها یک مجموعهداده بزرگ شامل ۷هزار نقشه زمینشناسی را گردآوری و ۳هزار پرسش استاندارد طراحی کردند تا توانایی مدلهای بینایی-زبانی در استخراج اطلاعات از نقشهها را بسنجند.
سپس دستیار GeoMap-Agent بر پایه GPT-۴ توسعه یافت که با راهبردهای خاص (استخراج سلسلهمراتبی اطلاعات نقشه، تزریق دانش تخصصی زمینشناسی به مدل، و بهبود پرامپتهای پرسش) توانست عملکرد بهتری در پاسخ به پرسشهای پیچیده از روی نقشه نشان دهد. این سامانه قادر است جزئیاتی نظیر عنوان، مقیاس، راهنمای نقشه، اسامی لایهها و گسلها را تشخیص داده و حتی به سوالات استنتاجی مانند «کدام بخش نقشه بیشترین خطر زمینلرزه را دارد؟» پاسخ دهد.
نتایج این تحقیق مسیر را برای توسعه دستیارهای هوشمند نقشهخوان زمینشناسی هموار کرده که میتوانند بهطور بالقوه توسط شرکتهای اکتشافی برای تحلیل سریعتر نقشههای مناطق جدید بهکار گرفته شوند.
بهطور خلاصه، در محافل علمی ترکیب مدلهای زبانی بزرگ با مسائل علوم زمین بهعنوان حوزهای مهم مطرح است و مقالات متعددی در دو سال اخیر منتشر شدهاند. برخی دیگر از کارهای قابل ذکر شامل مدل GPT۴GEO میشود که به بررسی اطلاعات جغرافیایی جهانی با رویکرد زبانمحور پرداخته است و نیز تحقیقات در زمینه ایجاد Embeddingهای مکانمبنای بزرگمقیاس برای تلفیق مختصات جغرافیایی در بردارهای زبانی است. این روند پژوهشی نشان میدهد که جامعه علمی در حال پایهریزی چارچوبهایی است که در آینده میتوانند بهطور مستقیم در صنعت اکتشاف معدن بهکار گرفته شوند.