Nükleer enerji dünyasında bir bilim kurgu daha gerçeğe dönüşüyor. Bilim insanları, insan müdahalesi olmadan kendi gücünü ayarlayabilen yapay zeka kontrollü nükleer mikroreaktörler geliştirdi. Bu sistem, adeta reaktörün beyni gibi davranıp kendi kendine düşünebiliyor. Araştırmacılar, yeni teknolojinin nükleer mikroreaktörleri “daha güvenli, daha esnek ve olağanüstü derecede hassas” hale getirdiğini aktarıyor. Teknoloji gelecekte tam potansiyeline geldiğinde; uzay görevleri, savaş alanları ve afet bölgelerinden uzak alanlara kurulmasıyla biyolojik makineler olmadan da enerji santrallerinin çalışması hedeflenmektedir.1
Michigan Üniversitesi ve Idaho Ulusal Laboratuvarı’nın (INL) ortak çalışmasıyla, derin pekiştirmeli öğrenme (RL) tabanlı bir yapay zekanın, mikroreaktörlerin güç kontrolünü tamamen kontrol edebildiğini aktarıyor. Araştırmacılar, geliştirdikleri yöntemin performansını açıklarken “RL tabanlı kontrol, kısa transiynetlerde PID kontrolüne göre hatayı yarı yarı azaltmıştır” diyerek sonuçların çarpıcılığına dikkat çekmektedir.1

Şekil 1, derin pekiştirmeli öğrenme tabanlı mikroreaktör güç kontrol sisteminin temel çalışma yapısını göstermektedir. Bu yapıda yapay zeka ajanı, reaktörün mevcut ve hedef güç seviyeleri ile kontrol tamburlarının anlık konumlarını içeren durum bilgilerini kullanarak her bir tambur için uygun açısal hareket konumları üretmektedir. Ajanın çevreden aldığı ödül sinyali, hedef güç seviyesine hızlı ve kararlı bir şekilde ulaşmayı teşvik edecek bir biçimde tanımlanmıştır. Böylece sistem, operatöre ihtiyaç duymadan reaktör gücünü güvenli bir şekilde otonom olarak kontrol edebilmektedir.3
Yapay zeka, reaktörün güç seviyesini belirleyen kontrol tamburlarını gerçek zamanlı hareket ettirebiliyor. Sıcaklığı, nötron akısını ve yük değişimlerini takip ederek en uygun tepkiyi verebilmektedir. Araştırmacılar, bu kontrol mekanizmasını “Reaktörün davranışını deneme-yanılma öğrenen bir dijital operatör” olarak adlandırıyor.3
Araştırmacılar, deep RL modellerinin tambur kontrollü mikroreaktörlerde hedef güce hızlı ve kararlı bir şekilde ulaşabildiğini göstermiştir. Model, reaktörün anlık durumuna göre düşünerek tambur hareketlerini tamamen otonom bir şekilde optimize etmekte. Buna ek olarak klasik PID sistemlerinin aksine karmaşık güç profillerine kolaylıkla uyum sağlayabildiği aktarılmıştır. Ayrıca sensör gürültüsü, ani yük değişimleri ve belirsizlik koşullarında dahi kararlılığını koruyarak dayanıklı bir kontrol mekanizması sunmaktadır.3
Çalışma, tek bir yapay zeka tabanlı olmamakla birlikte “çoklu ajan öğrenme” (MARL) denilen yöntemi kullanarak her kontrol tamburunu bağımsız bir şekilde kontrol edebilen yapay zeka atadı. Bu sayede tamburlar, birbirinden bağımsız çalışsa bile ortak bir şekilde hareket ederek yüksek bir uyum oranı yakalamıştır. Reaktörün güç dağılımında neredeyse kusursuz bir simetri elde edilmeside bunu kanıtlar niteliktedir. MARL yönteminin en dikkat çekici yönlerinden biri çok kısa sürede eğitilebilmesidir ve bunun sayesinde gelecekte geliştirilebilecek daha karmaşık mikroreaktörleri tasarlamak ve anlamak için yüksek bir potansiyel taşımaktadır.1
Farklı bir çalışmada ise yapay zekanın yalnızca tambur kontrolünde değil, nükleer reaktörlerin en zorlu süreçlerinden olan “kritiklik araması” ve “güç şekillendirme” görevlerinde de başarılı olduğu ortaya konmuştur. Bu süreçler; reaktörün güvenli bir şekilde kritik hale getirilmesi, çekirdek içindeki güç dengesi ve tüm deney süresince dengenin korunması gibi kritik aşamalar içerdiği için risklidir. Çalışmada kullanılan çok adımlı RL modeli, reaktörü güvenli sınırlar içerisinde tutarak hedef güç seviyesine kendi ulaşabilmiştir. Araştırmacılar ayrıca, modelin yalnızca hedef güce ulaşmakla kalmayıp çekirdeğin farklı bölgelerine yayılan nötron akısını optimize ederek güç profilini operatörlerden daha hızlı stabilize edebildiğini aktarmıştır.2
Güç ölçümlerine rastgele gürültü verildiğinde PID sistemi kararsız davranırken RL ve MARL algoritmaları daha stabil bir davranış göstermiştir. Bu özellik uzun süreli uzay görevleri ve bakım yapılamayan alanlar veya arızaya açık sahalar için büyük bir önem taşımaktadır.3
Araştırma halen noktasal kinetik modele dayanmakta ve reaktörün üç boyutlu davranışları tamamen modellenmiş değildir. Araştırmacılar, gelecekte yüksek doğrulukta simülasyonlar ve deneysel veriler ile sistemi dahada geliştirmeyi hedeflemektedir. Bunun yanında da eğitim süresini kısaltmak ve modelin öğrenme kapasitesini artırmak amacıyla GAN ve difüzyon tabanlı yöntemlerin RL ile entegre edilmesi de planlanmaktadır.1
Salim Bak
Kaynaklar
- https://techxplore.com/news/2025-06-nuclear-microreactor.html
- Radaideh, M. I., Tunkle, L., Price, D., Abdulraheem, K., Lin, L., & Elias, M. (2025). Multistep criticality search and power shaping in nuclear microreactors with deep reinforcement learning. Nuclear Science and Engineering, 1-13.
- Tunkle, L., Abdulraheem, K., Lin, L., & Radaideh, M. I. (2025). Nuclear Microreactor Control with Deep Reinforcement Learning. arXiv preprint arXiv:2504.00156.
