شروع به کار سامانه پردازش اتوماتیک در کتابخانه ملی
به گزارش بازیکده، سامانه پردازش اتوماتیک با هدف استخراج فراداده های توصیفی کتاب، انتها نامه و مقاله با یاری هوش مصنوعی در سازمان اسناد و کتابخانه ملی ایران رونمایی شد.
سامانه پردازش اتوماتیک با هدف استخراج فراداده های متادیتای توصیفی از قبیل عنوان، ناشر و نام پدیدآورنده و غیره به وسیله هوش مصنوعی در سازمان اسناد و کتابخانه ملی ایران با حضور مهدی محمدی، دبیر ستاد توسعه فناوری های اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری، بهروز مینایی، دانشیار گروه هوش مصنوعی، رباتیک دانشگاه علم و صنعت، علیرضا نوروزی، دانشیار گروه علم اطلاعات و دانش شناسی دانشگاه تهران، مظفر پاسدار شیرازی، معاون توسعه مدیریت و منابع و سرپرست حوزه دیجیتال و علیرضا انتهایی، مدیرکل پردازش منابع دیجیتال در محل اندیشگاه سازمان اسناد و کتابخانه ملی ایران رونمایی شد.
علیرضا انتهایی، مدیرکل پردازش منابع دیجیتال در شرح راه اندازی این سامانه گفت: سامانه پردازش اتوماتیک به منظور استخراج عناصر برای جست وجوی اطلاعات راه اندازی شده است که در کتاب ها و منابع فیزیکی به آن فهرست نویسی می گویند. این فرآیند از گذشته در کتابخانه های دنیا انجام می شد، اما امروز با وجود کتابخانه های هوشمند از آن به عنوان متادیتا یاد می گردد.
وی به اهداف راه اندازی این سامانه اشاره نمود و گفت: سازمان اسناد و کتابخانه ملی ایران با طراحی و راه اندازی این سامانه در کوشش است، فراداده های توصیفی از قبیل عنوان، ناشر و نام پدیدآورنده و غیره را به وسیله هوش مصنوعی استخراج کند و در نهایت نیروی انسانی فقط نقش نظارتی دارد و در این فرآیند از هوش مصنوعی و یادگیری عمیق ماشینی استفاده شده است.
مدیرکل پردازش منابع دیجیتال سازمان اسناد و کتابخانه ملی ایران سپس اظهار کرد: هوش مصنوعی یک فرایند یادگیری ادامه دار است که با بهره گیری از این امکان، سامانه پردازش اتوماتیک سازمان اسناد و کتابخانه ملی ایران در ادامه جهت به مرور از دقت بیشتری نیز برخوردار خواهد شد.
انتهایی همچنین به فرآیند و کارکردهای این سامانه اشاره نمود و اضافه نمود: این سامانه نسخه دیجیتال سرانجام نامه را به وسیله سامانه نویسه خوان(OCR) به متن تبدیل می نماید و در گام های بعدی هوشمندانه فراداده های توصیفی در منابع اطلاعاتی را بر اساس استانداردهای تعریف شده استخراج می نماید. دقت به کار گرفته شده در این سامانه شاید هم اکنون عدد قابل ملاحظه ای در حوزه منابع توصیفی باشد به گونه ای که در مورد سرانجام نامه ها حدود 80 درصد دقت استخراج فراداده و 95 درصد صحت اطلاعات استخراج شده رسیده است، این سازمان در کوشش است این مهم را درباره کتاب و مقاله نیز توسعه دهد.
مدیرکل فراهم آوری و پردازش منابع دیجیتال سازمان اسناد و کتابخانه ملی ایران ادامه داد: سرعت این سامانه با توجه به زیرساخت های موجود حدود دو مدرک در دقیقه است، البته این امر با تقویت زیرساخت می تواند افزایش یابد.
انتهایی ضمن قدردانی از حمایت های معاونت علمی و فناوری ریاست جمهوری در فراهم سازی زیرساخت پردازش اتوماتیک، یادآور شد: قابلیت های دیگری نیز در سامانه دیجیتال سازمان اضافه نموده شده است که می توان به قابلیت جست وجوی معنایی به یاری نمودار گرافیکی اصطلاح نامه اصفا اشاره نمود.
مظفر پاسدار شیرازی، معاون توسعه مدیریت و منابع انسانی و سرپرست معاونت دیجیتال سازمان اسناد و کتابخانه ملی ایران نیز ضمن قدردانی از حمایت های مادی و معنوی اجرا شده از سوی معاونت علمی و فناوری ریاست جمهوری در راه اندازی این سامانه گفت: ظرف یک سال گذشته با یاری پنجره واحد نشر فهرست 100 درصد کتاب های کشور پیش از انتشار توسط متخصصان پردازش سازمان اسناد و کتابخانه ملی ایران فراوری می گردد، نکته ای که پیش از این حدود 90 درصد بود. به بیان دیگر پردازش کتاب از منظر کمی تکمیل شده است. این پروژه و سایر پروژه های حوزه نوآوری سازمان ذیل عنوان پردازش اتوماتیک کوشش دارد تا نخست سرعت و دقت فرایندهای پردازش منابع ورودی سازمان را افزایش دهد و در ادامه به ارتقای کیفیت فهرست فراوریی سازمان نیز یاری کند.
معاون توسعه مدیریت و منابع سازمان اسناد و کتابخانه ملی ایران ادامه داد: در کوشش هستیم در حوزه فهرست نویسی توصیفی و فهرست نویسی تحلیلی از فناوری های جدید استفاده کنیم، در این بین کیفیت متادیتای فراوریی در این حوزه نقش و صندلی ویژه ای دارد به طوری که در نهایت با استفاده از این ابزار همه کتابخانه های کشور به یک متادیتای سریع تر، به روزتر و با کیفیت بالاتری دسترسی خواهند داشت.
او گفت: یک پروژه موازی دیگر با این امر نیز برای فهرست نویسی تحلیلی با یاری استارتاپ ها و شرکت های فناوری در سازمان اسناد و کتابخانه ملی ایران در حال اجرا است که در نهایت سامانه با یاری هوش مصنوعی با آنالیز متن کتاب ارائه شده پیشنهاد رده بندی کتاب را بر اساس استاندارد کتابخانه کنگره به متخصصان فهرست نویس ما پیشنهاد می دهد و فهرست نویسان سازمان اسناد و کتابخانه ملی ایران این پیشنهادات را ارزیابی و انتخاب می نمایند.
او ادامه داد: سازمان اسناد و کتابخانه ملی ایران در راستای خدماتی که از شرکت های فناور می گیرد در کوشش است خدمات مورد احتیاج این شرکت ها را نیز تامین کند، چرا که یکی از دلایل عدم توسعه هوش مصنوعی در زبان فارسی نبود بیگ دیتا در زبان فارسی است؛ داده های کتابخانه ملی به مثابه یک فلز گران بها در معدن است که برای بهره برداری فناوران احتیاج به استخراج و آماده سازی دارد.
معاون توسعه مدیریت و منابع سازمان اسناد و کتابخانه ملی ایران اعلام نمود: نگاه سازمان اسناد و کتابخانه ملی ایران تا به امروز سرویس دهی و ارائه خدمات به پژوهشگران بوده اما امروز در کوشش است داده های موجود در این سازمان را به فعالان عرصه هوش مصنوعی کشور نیز ارائه دهد تا این عزیزان بتوانند خدمات متنوعی را به کشور و جامعه فارسی زبان ارائه دهند.
همچنین مهدی محمدی، دبیر ستاد توسعه فناوری های اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری گفت: تحول فناورانه در سازمان اسناد و کتابخانه ملی ایران برای فعالان حوزه هوش مصنوعی غنیمت است و می تواند نقش ویژه ای را برای شکل گیری تکنولوژی های جدید توسط استارتاپ ها ایفا نماید.
دبیر ستاد توسعه فناوری های اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری ادامه داد: در حال حاضر فرصت ها در حوزه هوشمندسازی کوتاه است و هیچ یک از کشورها فرصت عقب ماندگی و تقلید را ندارند. کشورها باید از این امکان تا سال 2035 بهره لازم را برده باشند و حرفی برای گفتن داشته باشند.
محمدی سپس با بیان این که بهره مندی از هوش مصنوعی امروزه برای کشورها انتخاب نیست بلکه یک ضرورت است گفت: بهره مندی از دیتا در هوش مصنوعی به منزله امکانی ویژه در دنیای امروز است. سازمان هایی که دیتا دارند امروز ثروتمند هستند و نمونه شاخص این امر سازمان اسناد و کتابخانه ملی ایران است. این سازمان به خوبی در جهت بهره مندی از دیتاهای موجود خود قرار گرفته است و تصمیم ندارد تا انباشتی از داده درست کند و این اطلاعات را نگاه دارد.
او اعلام نمود: بهره مندی از این دیتاها زمینه ظهور و بروز استارتاپ های مختلف را فراهم می نماید به طوری که حتی این مهم می تواند برای سازمان اسناد و کتابخانه ملی ایران ثروت به همراه باشد.
در ادامه این مراسم بهروز مینایی، دانشیار گروه هوش مصنوعی و رباتیک دانشگاه علم و صنعت با اشاره به اهمیت راه اندازی سامانه پردازش اتوماتیک گفت: ارتباط سازمان اسناد و کتابخانه ملی ایران با دنیای هوش مصنوعی و فناوری متحول شده است.
مینایی به اهمیت و صندلی هوش مصنوعی در دنیا امروز اشاره نمود و اضافه نمود: هم اکنون بسیاری از کشورهای دنیا از جمله آلمان حمایت های ویژه ای را از استارتاپ ها به منظور پیشبرد فرآیندهای هوش مصنوعی صورت می دهند.
او همچنین اعلام کرد: سازمان اسناد و کتابخانه ملی ایران غنی ترین صندلی برای کتاب، سند و تاریخ شفاهی است ضمن این که این سازمان منبعی برای فعالیت های هوش مصنوعی به شمار می رود؛ با استفاده از ابراطلاعاتی که سازمان اسناد و کتابخانه ملی ایران از اسناد سال های متمادی به وجود می آورد می توان مجموعه ای غنی ایجاد کرد، این مجموعه بی تردید سرچشمه بسیاری از پروژه های کلیدی کشور خواهد بود و یاری می نماید صدها دانش جدید از متون وب ایجاد گردد.
علیرضا نوروزی، دانشیار گروه علم اطلاعات و دانش شناسی دانشگاه تهران نیز گفت: سازمان اسناد و کتابخانه ملی ایران می تواند در حوزه هوش مصنوعی پیشگام باشد، اقدام امروز سازمان اسناد و کتابخانه ملی ایران با رویکرد استخراج اطلاعات کتاب شناسی با استفاده از سیستم های هوش مصنوعی راهنمایی شده قابل تحسین است.
او ضمن اعلام خوش بینی به اجرا و تداوم این پروژه، ادامه داد: امید است در آینده نزدیک شاهد اجرای طرح ها و پروژه های دیگر با بهره مندی از گنجینه اسناد سازمان اسناد و کتابخانه ملی ایران باشیم. با توجه به حضور و فعالیت تیم جوان در سازمان اسناد و کتابخانه ملی ایران در حوزه هوش مصنوعی به آینده این سازمان امیدوار هستم.
دانشیار گروه علم اطلاعات و دانش شناسی دانشگاه تهران اعلام نمود: در حوزه داده های پیوندی سازمان اسناد و کتابخانه ملی ایران می تواند همانند کتابخانه کنگره آمریکا و دیگر کشورها پیشگام باشد و از هوش مصنوعی و لینک دیتا بهره مند گردد.،ایسنا
منبع: ایران آنلاین