عصر داده‌ها در معدن

محمد فهیمی‌نیا-دکترای اکتشاف معدن و عضو کارگروه هوش مصنوعی موسسه یونیدرو

 

محمد+فهیمی_نیا

امروزه اکتشاف معدن وارد عصر داده‌های عظیم شده و ترکیب علوم زمین با علوم داده تحول بزرگی در این حوزه ایجاد کرده است. فرآیندهای اکتشافی منابع معدنی شامل گردآوری انبوهی از داده‌های زمین‌شناسی، ژئوشیمیایی، ژئوفیزیک، تصاویر ماهواره‌ای و گزارش‌های متنی است که تحلیل آنها از توان روش‌های سنتی فراتر رفته است. هوش مصنوعی و یادگیری ماشین به‌عنوان راهکاری برای مواجهه با این چالش پدیدار شده‌اند. به‌کارگیری الگوریتم‌های پیشرفته داده‌محور می‌تواند به بهبود دقت نقشه‌برداری پتانسیل معدنی و کاهش آثار زیست‌محیطی عملیات اکتشافی کمک کند.

به بیان دیگر، روش‌های یادگیری ماشین اکنون در خدمت اکتشاف و نقشه‌برداری منابع معدنی قرار گرفته‌اند تا با افزایش دقت، نیاز به حفاری‌های پراکنده و پرهزینه را کاهش دهند. این تحول دیجیتال در صنعت معدن، نویدبخش افزایش چشم‌گیر بهره‌وری و سرعت در شناسایی ذخایر جدید است. با این حال، داده‌های علوم زمین ذاتا پیچیده، ناهمگون و چندمقیاسی هستند. چالش‌هایی نظیر ناکافی‌بودن داده‌های برچسب‌خورده، تفاوت شرایط زمین‌شناسی مناطق مختلف و نیاز به تفسیر قابل اعتماد خروجی مدل‌ها، هنوز پابرجاست. برای غلبه بر این مشکلات، نسل جدیدی از مدل‌های هوش مصنوعی با عنوان مدل‌های بنیادین (Foundation Models) معرفی شده‌اند.

پیوند علوم زمین داده‌محور با اکتشاف معدن

اکتشاف منابع معدنی ذاتا یک فعالیت میان‌رشته‌ای است که علوم زمین و مهندسی معدن را با علوم داده و فناوری اطلاعات پیوند می‌دهد. داده‌های اکتشافی شامل انواع مختلفی هستند: از داده‌های کمّی اندازه‌گیری‌شده در آزمایشگاه‌های ژئوشیمی گرفته تا داده‌های‌برداری و تصویری در ژئوفیزیک و سنجش از دور و همچنین مشاهدات کیفی و توصیفی زمین‌شناسان در گزارش‌ها و لاگ‌های حفاری. ترکیب و تفسیر این داده‌های چندمنظوره برای شناسایی مناطق امیدبخش معدنی اهمیت حیاتی دارد. مدل‌های زبانی زمین‌شناسی تخصصی: یکی از پیشرفت‌های برجسته، توسعه مدل‌های زبانی عظیم مختص علوم زمین بوده است. برای مثال، در سال۲۰۲۳ مدلی به نام GeoGalactica معرفی شد که یک LLM با ۳۰میلیارد پارامتر ویژه حوزه ژئوساینس است. این مدل با پردازش ۶۵میلیارد کلمه از متون علمی زمین‌شناسی و همچنین روی مجموعه‌ای از پرسش‌وپاسخ‌های تخصصی آموزش دیده است. GeoGalactica به‌عنوان بزرگ‌ترین مدل زبانی زمین‌شناسی تاکنون شناخته می‌شود و به‌صورت متن‌باز در اختیار محققان قرار گرفته است. آزمایش‌ها نشان داده که این مدل در پاسخ‌گویی به سوالات دشوار زمین‌شناسی و انجام وظایف مختلف پردازش زبان مانند استخراج دانش و طبقه‌بندی اسناد بهتر از مدل‌های عمومی عمل می‌کند.

همچنین پژوهش دیگری در سال۲۰۲۴ توسط Pyo و Chiang معرفی شد که رویکردی خلاقانه برای پیونددهی خودکار سوابق معدنی ارائه می‌داد. در این روش، ابتدا یک مدل زبانی بزرگ (LLaMA) حجم زیادی از داده‌های خام مربوط به مکان‌های معدنی را برچسب‌گذاری می‌کند و ارتباط بین رکوردهای پراکنده (با نام‌های متفاوت یا مختصات مبهم) را مانند یک کارشناس باتجربه تشخیص می‌دهد. سپس از این داده‌های برچسب‌خورده برای آموزش یک مدل کوچک‌تر و سریع‌تر استفاده می‌شود تا بتوان تعداد عظیمی از رکوردها را به‌صورت خودکار لینک کرد.

نتیجه کار بسیار موفقیت‌آمیز بود. این سامانه ترکیبی دقت اتصال داده‌ها را ۴۵درصد بیشتر از روش‌های سنتی اعلام کرد و در عین حال بسیار سریع‌تر از استفاده مستقیم از یک LLM عظیم عمل کرد. به عبارتی، این رویکرد توانست سرعت‌بخشی به یکپارچه‌سازی داده‌های قدیمی و جدید اکتشاف را محقق کند. برای مثال، در عمل یک شرکت معدن می‌تواند هزاران گزارش حفاری قدیمی را با داده‌های نقشه‌برداری جدید مرتبط کند و تصویر کامل‌تری از پتانسیل معدنی منطقه به‌دست آورد.

ترکیب مدل‌های زبانی با داده‌های مکانی: پروژه GeoMap-Bench و GeoMap-Agent (سال ۲۰۲۵) که با همکاری Microsoft Research Asia و آکادمی علوم زمین چین انجام شد، مثال خوبی از تلاش پژوهشی برای ارزیابی و ارتقای درک نقشه‌های زمین‌شناسی توسط AI است. آنها یک مجموعه‌داده بزرگ شامل ۷‌هزار نقشه زمین‌شناسی را گردآوری و ۳‌هزار پرسش استاندارد طراحی کردند تا توانایی مدل‌های بینایی-زبانی در استخراج اطلاعات از نقشه‌ها را بسنجند.

سپس دستیار GeoMap-Agent بر پایه GPT-۴ توسعه یافت که با راهبردهای خاص (استخراج سلسله‌مراتبی اطلاعات نقشه، تزریق دانش تخصصی زمین‌شناسی به مدل، و بهبود پرامپت‌های پرسش) توانست عملکرد بهتری در پاسخ به پرسش‌های پیچیده از روی نقشه نشان دهد. این سامانه قادر است جزئیاتی نظیر عنوان، مقیاس، راهنمای نقشه، اسامی لایه‌ها و گسل‌ها را تشخیص داده و حتی به سوالات استنتاجی مانند «کدام بخش نقشه بیشترین خطر زمین‌لرزه را دارد؟» پاسخ دهد.

نتایج این تحقیق مسیر را برای توسعه دستیارهای هوشمند نقشه‌خوان زمین‌شناسی هموار کرده که می‌توانند به‌طور بالقوه توسط شرکت‌های اکتشافی برای تحلیل سریع‌تر نقشه‌های مناطق جدید به‌کار گرفته شوند.

به‌طور خلاصه، در محافل علمی ترکیب مدل‌های زبانی بزرگ با مسائل علوم زمین به‌عنوان حوزه‌ای مهم مطرح است و مقالات متعددی در دو سال اخیر منتشر شده‌اند. برخی دیگر از کارهای قابل ذکر شامل مدل GPT۴GEO می‌شود که به بررسی اطلاعات جغرافیایی جهانی با رویکرد زبان‌محور پرداخته است و نیز تحقیقات در زمینه ایجاد Embeddingهای مکان‌مبنای بزرگ‌مقیاس برای تلفیق مختصات جغرافیایی در بردارهای زبانی است. این روند پژوهشی نشان می‌دهد که جامعه علمی در حال پایه‌ریزی چارچوب‌هایی است که در آینده می‌توانند به‌طور مستقیم در صنعت اکتشاف معدن به‌کار گرفته شوند.

ارسال نظر