رکورد قبلیرکورد بعدی

" نويسه خوان نوري فارسي با استفاده شبكه عصبي حافظه كوتاه مدت ماندگار "


نام مرکز : دانشگاه تهران. کتابخانه دانشکده علوم و فنون نوین
نوع مدرک : پایان نامه فارسی
شماره رکورد : 1358829
شماره مدرک : ۳۴۶۵۴۱
زبان مدرک : فارسی
سرشناسه : خسروبيگي، زهره
عنوان : نويسه خوان نوري فارسي با استفاده شبكه عصبي حافظه كوتاه مدت ماندگار [پايان نامه]/ زهره خسروبيگي
صفحه شمار : ‮‭۹۳‬ص.‬: تصوير، نمودار، جدول
دانشگاه/ دانشکده : دانشگاه تهران
رشته تحصیلی : مهندسي فناوري اطلاعات
مقطع تحصیلی : كارشناسي ارشد ناپيوسته
تاریخ دفاع : ۱۳۹۷/۱۱/۳۰
يادداشت : چكیده: به فارسی و انگلیسی
چکيده : نويسه‌خوان نوري (OCR) سيستمي براي تبديل تصاوير حاوي متن به متن قابل ‌ويرايش مي‌باشد. براي اين تبديل، نياز به پردازش‌هايي بر روي تصوير مي‌باشد تا بتوان متن را از آن استخراج كرد. روشي كه به‌تازگي در OCR از آن استفاده شده است، روش شبكه‌ي عصبي حافظه كوتاه مدت ماندگار (LSTM) مي‌باشد. اين روش معماري از شبكه عصبي بازگشتي مي‌باشد كه در لايه پنهان آن، به‌جاي نورون، از بلاك‌هاي حافظه استفاده ‌مي‌شود. اين بلاك‌ها داراي سه دروازه ورودي، خروجي و فراموشي ‌مي‌باشند كه محتواي شبكه را كنترل ‌مي‌كنند. با استفاده از اين دروازه‌ها مشكل فراموشي داده‌هاي متوالي در بلند مدت حل شده است. معماري ديگري از LSTM وجود دارد كه LSTM دوطرفه (BLSTM) گفته مي‌شود كه به كل داده ها در هر مرحله دسترسي دارد. دراين معماري، داده‌ها يك‌بار از ابتدا به انتها به بلاك‌هاي LSTM لايه پنهان و يك‌بار نيز از انتها به ابتدا به بلاك‌هاي لايه پنهان ديگري داده ‌مي‌شود. به اين ترتيب، شبكه در هر زمان به كل اطلاعات قبل و بعد از داده فعلي دسترسي دارد. با افزايش تعداد لايه‌هاي پنهان شبكه، معماري شبكه عميق را خواهيم داشت كه براي داده‌هاي با حجم بالا بسيار مناسب مي‌باشند. در اين پايان‌نامه ابتدا با استفاده از شبكه پيچشي ويژگي‌هاي تصوير استخراج شده و سپس به‌عنوان ورودي به شبكه BLSTM عميق داده مي‌شود كه براي داده‌ي متوالي و حجيم همانند متن مناسب است. نويسه‌خوان نوري تسركت كه روش مرجع مي‌باشد، از معماري LSTM براي متن فارسي استفاده كرده است و قابليت تشخيص انگليسي در متن فارسي را ندارد و دقت آن براي متن فقط فارسي 88% است كه ما توانسته‌ايم با استفاده از معماري Deep BLSTM، دقت زبان فارسي بر روي داده فقط فارسي به 96% و براي داده فارسي-انگليسي دقت 90% افزايش دهيم.
: Optical Character Recognition (OCR) is a system to convert images including text into an editable text. For this purpose, converting is required to process images and extract context . Recently, "deep bidirectional long short-term memory (Deep BLSTM) network" method which uses hidden blocks instead of neurons is used for OCR. Each hidden block involves input, forget and output gates which control context of network. Using these gates, the problem of vanishing gradient in long and continuous data is solved . Another architecture of LSTM, called BLSTM, that has access to all data in each step . In BLSTM, once that data are given to LSTM hidden blocks from beginning and then are given to another LSTM hidden blocks from end. Therefore, network has access to all data in previous and next steps. By increasing the number of hidden blocks, we have deep neural network architecture which is suitable to mass data. In this thesis, first, features of each image are extracted by Convolutional Neural Network (CCN) and are given to Deep BLSTM as input. Deep BLSTM is efficient method for long and continuous data similar text string . "Tesseract" OCR system which is reference method is using LSTM architecture for Persian texts but cannot recognize English text inside Persian text and its accuracy for Persian only text is 88%. Using deep LSTM architecture, we have increased the accuracy for Persian only text to 96% and for mixed Persian-English text to 90%.
موضوع : نويسه‌خوان نوري
: شبكه پيچشي
: شبكه عصبي حافظه كوتاه‌مدت ماندگار يك‌طرفه و دوطرفه
: تصاوير ساختار پيچيده
: پس‌پردازش.
شناسه افزوده : ويسي، هادي ، استاد راهنما
: ويسي، هادي ، استاد سمينار
شناسه افزوده : دانشگاه تهران-- علوم و فنون نوين-- بين رشته اي فناوري-- مهندسي فناوري اطلاعات
عنوان به زبان ديگر : Persian Optical Character Recognition Using Long Short Term Memory
کپی لینک

پیشنهاد خرید
پیوستها
Search result is zero
موجودی
کتابخانه مرکزی
نمایش کامل جزئیات | عدم نمایش جزئیات
جزئیاتمحل نگهداریشماره ثبتشناسه بازیابیجلدوضعيتتاريخ برگشت
تالار اطلاع رسانی کتابخانه مرکزی۹۲۸۴۷موجود‭‬
نظرسنجی
نظرسنجی منابع

1 - کیفیت نمایش فایلهای دیجیتال چگونه است؟




 

2 - کیفیت دانلود فایلهای دیجیتال چگونه است؟