وقتی تحلیل دادههای انبوه به کمک سیاستگذاران میآید
نتایج پژوهش دانشیار دانشگاه تهران درباره یادگیری بازنمایی گراف توسط الزویر منتشر شد | پیشبینی الگوی رفتاری کاربران با پردازش کلان دادهها
به گزارش روابط عمومی دانشگاه تهران، دکتر هادی زارع، دانشیار دانشکده علوم و فنون نوین دانشگاه تهران، درباره ماهیت و روند این پژوهش گفت: «در دنیای امروز با رشد روزافزون شبکههای اجتماعی و استفاده از فروشگاههای اینترنتی با حجم عظیمی از دادهها روبرو هستیم که کاوش و استخراج الگوهای مفید از آنها میتواند منجر به تولید محصولات مبتنی بر داده شود که دارای اهمیت زیادی در حوزههای مالی، پزشکی و حمل و نقل است. به صورت دقیقتر میتوان بیان کرد که اینگونه دادهها در قالب ساختارهای گرافی، امروزه به ساختاردادهای فراگیر و یک زبان جهانی برای توصیف سیستمهایی همچون شبکههای حملونقل شهری، شبکههای پروتئینی و شبکههای اجتماعی تبدیل شدهاند.»
این پژوهشگر حوزه علوم داده افزود: «چالش اساسی در استفاده از الگوریتمهای یادگیری ماشین روی این ساختاردادهها، یافتن راهی برای استفاده از اطلاعات ساختاری گراف در کنار اطلاعات مربوط به ویژگیها است. به عنوان مثال از یک طرف با شبکهای از کاربران روبرو هستیم و از طرف دیگر اطلاعات مربوط به پروفایل کاربران نیز میتواند بسیار ارزشمند باشد که در نظر گرفتن توأمان آنها در الگوریتمهای حوزه علوم داده از اهمیت فراوانی برخوردار است؛ چراکه بر اساس آنها میتوان به پیشبینی الگوی رفتاری کاربران و بهرهگیری از آن در کاربردهای مختلف پرداخت.»
وی ادامه داد: «در سالهای اخیر روشهایی که به صورت خودکار، ساختار گراف را به بازنماییهایی با ابعاد پایینتر نگاشت میکنند، بسیار مورد توجه قرار گرفتهاند. به این دسته از روشها یادگیری بازنمایی گراف میگویند. با ظهور و موفقیت روزافزون الگوریتمهای یادگیری عمیق، کاربرد و تعمیم این الگوریتمها در روشهای یادگیری بازنمایی بسیار مورد توجه قرار گرفته است. به طوری که بسیاری از روشهای یادگیری بازنمایی بر پایه ساختار تعمیمیافته الگوریتمهای یادگیری عمیق، با نام شبکههای عصبی گرافی، بنا نهاده شدهاند و محور پژوهشهای قبلی در آزمایشگاه کاوش و شناخت اطلاعات بودهاند.»
یافتههای پژوهشهای انجامشده در این آزمایشگاه، پیشتر در قالب دو مقاله با همکاری پژوهشگرانی از دانشگاه RMIT و موناش استرالیا توسط مؤسسه مهندسان برق و الکترونیک و انتشارات الزویر منتشر شده است:
• Learning Graph Representations With Maximal Cliques:
• Deep node clustering based on mutual information maximization:
دانشیار دانشگاه تهران، در توضیح تازهترین نتایج این پژوهش گفت: «در مقالهای که به تازگی به صورت آنلاین در دسترس قرار گرفته و در شماره ماه فوریه سال ۲۰۲۳ نشریه Neurocomputing خواهد آمد، از ترکیب شبکههای عصبی گرافی با مدلهای مولد عمیق استفاده شده است. در این پژوهش، مدلهای مولد به دنبال یادگیری و تخمین توزیع اصلی دادههای ورودی هستند تا از این طریق بتوانند عدم قطعیت را در بازنماییها مدل کنند و همچنین توانایی تولید نمونههای جدید را داشته باشند. به این منظور به جای فرض سادهکننده و محدودکننده توزیع گاوسی برای دادههای ورودی، به دنبال مدلسازی دقیقتر پیچیدگیهای موجود در دادههای ورودی هستیم.»
دکتر زارع خاطرنشان کرد: «در دنیای واقعی پژوهشگران معمولاً با دادههای پیچیدهای مواجه میشوند که دارای یک ماهیت چندمدی میباشند و مدلسازی با در نظر گرفتن این فرض میتواند به ما در درک عمیقتر دادهها کمک کند. در این پژوهش بر اساس یک فرضیه طبیعی و با در نظر گرفتن حالات مختلفی که دادهها توسط آنها تولید شدهاند و بهرهگیری از مدلهای آمیخته گاوسی برای اولین بار موفق به استفاده از این فرض در ساختارهای شبکه عصبی گرافی شدهایم که نتایج قابل ملاحظهای داشته است.»
این مقاله بخشی از رساله دکتری غزاله نیکنام است که به راهنمایی دکتر هادی زارع و با همکاری اساتیدی از دانشگاههای اکسفورد انگلستان و گریفیث استرالیا تألیف شده است و از طریق پیوند زیر دستیافتنی است:
• Graph Representation Learning based on Deep Generative Gaussian Mixture Models:
دانشیار دانشکده علوم و فنون دانشگاه تهران، مسیر آینده این پژوهشها را اینگونه توصیف کرد: «این تحقیق در گامهای آینده، با لحاظ کردن پویایی دادهها و بهکارگیری آنها میتواند نقش مهمی در مدلسازی شبکههای حمل و نقل و پردازش کلان دادههای سامانههای پزشکی داشته باشد. در این مسیر نیز نتایج اولیه بسیار خوبی حاصل شده است. حمایت از این قبیل پژوهشها، میتواند زمینهای برای تحلیل دادگان انبوه کشور در سطح کلان فراهم کند که این به سیاستگذاران و برنامهریزان کمک شایان توجهی میکند.»
نظر شما :