Processing math: 27%

搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

光谱诊断中神经网络快速分析模型及外推方法

田文静 杨宗谕 许敏 龙婷 何小雪 柯锐 杨硕苏 余德良 石中兵 高喆

光谱诊断中神经网络快速分析模型及外推方法

田文静, 杨宗谕, 许敏, 龙婷, 何小雪, 柯锐, 杨硕苏, 余德良, 石中兵, 高喆
cstr: 32037.14.aps.74.20241739

Rapid analysis model and extrapolation method of neural network in spectral diagnostic

TIAN Wenjing, YANG Zongyu, XU Min, LONG Ting, HE Xiaoxue, KE Rui, YANG Shuosu, YU Deliang, SHI Zhongbing, GAO Zhe
cstr: 32037.14.aps.74.20241739
Article Text (iFLYTEK Translation)
PDF
HTML
导出引用
  • 对于旨在实现高参数和长脉冲运行的磁约束聚变装置而言, 基于离子温度实时测量的等离子体反馈控制至关重要, 而电荷交换复合光谱是等离子体离子温度的基本测量手段. 本文提出了一种基于神经网络的电荷交换复合光谱诊断数据快速分析方法, 并对其跨参数区间的外推能力进行研究. 该研究使用中国环流器二号A装置HL-2A的12.2×104个光谱数据及离线解谱获得的离子温度标签值构成数据集. 模型基于卷积神经网络, 相对于标签值实现了拟合优度R20.92的效果, 在推理阶段单光谱耗时小于1 ms, 相比传统方法加速了100—1000倍. 在外推能力方面, 提出基于低温度实验数据生成高温度的合成光谱数据的方法, 并通过在只包含离子温度2 keV以下的训练集中添加大约5%的合成数据, 大幅增加了模型在外推参数区间(2—4 keV)分析的准确性, 将模型在3—4 keV区间测试的误差降低了约60%. 该研究证明了在磁约束核聚变领域利用合成数据提升人工智能算法性能的可行性.
    Real-time measurement and feedback control of key plasma parameters are critical for future fusion reactor operation, with ion temperature being a vital control target as part of the triple product for fusion ignition. However, plasma diagnostics often require complex data analysis. A widely used method of obtaining ion temperature Ti from charge exchange recombination spectroscopy (CXRS) is iterative spectral fitting, which is time-consuming and requires expert intervention during data analysis. Therefore, the traditional method cannot meet the demand for real-time Ti measurement. Neural network (NN), which can learn the underlying relationships between the measured spectra and Ti, is a promising approach to cope with this problem. In fact, NN approach has been widely adopted in the field of magnetically confined plasma. Previous study in JET has achieved a satisfactory accuracy for inferring Ti from CXRS spectra compared with the traditional fitting results. Recently, the study of disruption prediction has achieved great progress with the help of deep NNs. However, these researches are conducted on steadily-operating devices, where for NN models, the data distribution of training set is similar to that of test set. This is not the case for newly-built tokamaks like HL-3, nor for future fusion reactors such as ITER. For new devices, there will be a period for the plasma parameters to rise from low to high ranges. In this case, investigating the extrapolation capability of NN models based on low parameter training data is of paramount importance. A convolutional neural network (CNN)-based model is proposed to accelerate the analysis of spectral data of CXRS, with a focus on investigating the model’s extrapolation capability in a much higher Ti range. The dataset contains about 122000 spectral data, as well as their corresponding Ti inferred from offline iterative process. The results demonstrate that the CNN-based model achieves excellent analysis of Ti as indicated by a coefficient of determination (R²) of 0.92, and reduces the inference time for analyzing a single spectrum to less than 1 ms, reaching 100–1000 times faster than traditional spectral fitting methods. However, the performance of the data-driven neural network model is limited by challenges such as insufficient data and imbalanced data distribution, which further deteriorates the extrapolation capability. Generally, data with higher Ti account for a small portion of the total dataset. In our study, only about 5% of the spectra correspond to Ti>2keV (ranging from 2 to 4 keV). However, they reflect the temperature of central plasma, which is more important for assessing the performance of plasma. To overcome this limitation, this study synthesizes high-temperature data based on experimental data from discharges with Ti in low-temperature range. By incorporating 5% synthetic data into the training set only consisting of data with Ti<2keV, the model’s extrapolation capability is extended to cover the whole range of Ti<4keV. The mean relative error (MRE) of the model in the range of 3keV<Ti<4keV is reduced from 35% to below 15%, corresponding to a reduction of approximately 60% relative to the MRE before adding synthetic data. This approach demonstrates the feasibility of using synthetic data to enhance the performance of artificial intelligence algorithms in the field of magnetic confinement fusion. These findings provide valuable insights for the development of real-time ion temperature measurement and feedback control for future high-parameter fusion devices. Furthermore, the study lays a foundation for research in areas that require high-performance cross-device characteristic, such as machine learning-based disruption prediction and tearing mode control.
      PACS:
      89.30.Jj(Nuclear fusion power)
      52.70.-m(Plasma diagnostic techniques and instrumentation)
      07.05.Mh(Neural networks, fuzzy logic, artificial intelligence)
      02.70.Hm(Spectral methods)
      通信作者: 杨宗谕, zy-yang@swip.ac.cn ; 龙婷, longt@swip.ac.cn
    • 基金项目: 国家磁约束核聚变能发展研究专项(批准号: 2022YFE03100004)、国家自然科学基金青年科学基金(批准号: 12405253, 12375210)和四川省自然科学基金青年科学基金(批准号: 2024NSFCSC1335)资助的课题.
      Corresponding author: YANG Zongyu, zy-yang@swip.ac.cn ; LONG Ting, longt@swip.ac.cn
    • Funds: Project supported by the National Magnetic Confinement Fusion Energy Development Research Program, China (Grant No. 2022YFE03100004), the Young Scientists Fund of the National Natural Science Foundation of China (Grant Nos. 12405253, 12375210), and the Young Scientists Fund of the Natural Science Foundation of Sichuan Province, China (Grant No. 2024NSFCSC1335).

    我国核能发展实施的三步走战略中, 聚变能被视为解决能源问题的最终方案. 对于未来聚变堆运行而言, 实时测量和反馈控制等离子体关键物理 量是至关重要的[1,2]. 然而, 获得这些物理量通常需要对相关诊断数据进行较为复杂的数据处理, 该过程中往往涉及到较多的可调经验参数. 在这些物理量中, 离子温度是聚变点火条件所定义的三乘积 参数的其中一项, 是至关重要的控制对象. 针对离子温度, 聚变等离子体装置最通用的诊断方法是电荷交换复合光谱(charge exchange recombination spectroscopy, CXRS), 该方法在JET[3], DIII-D[4], HL-3[5], EAST[6]等国内外聚变装置中得到了广泛应用并作为常规诊断运行. 通过光谱信号分析获得离子温度, 通常需要从一系列重叠的光谱中拟合提取出特定谱线. CXRS谱分析最常用的是最小二乘迭代拟合方法, 但该方法往往耗时较长, 并且分析过程通常依赖于专业技术人员的干预, 导致其难以在放电过程中实现实时测量.

    基于数据驱动的神经网络(neural networks, NN)能够捕捉诊断测量数据与其背后物理量之间复杂的关系. 通过对模型进行训练, 以最小化模型输出与传统方法获得的标签之间的误差, 从而实现对物理量的高效估计. 早在20世纪90年代, Bishop等[7]和Svensson等[8]在JET上使用神经网络分析CXRS光谱以实时获得离子温度. 近年来, 神经网络方法已经被广泛应用于聚变等离子体物理研究. Abbate等[9]在DIII-D上通过神经网络进行关键参数剖面预测, Zheng等[10]在HL-3装置上用神经网络代理了平衡反演程序, 对等离子体位形进行实时计算, Yang等[11]在HL-2A装置上利用卷积神经网络进行等离子体大破裂预测及实时缓解, Seo等[12]在KSTAR和DIII-D装置上基于深度神经网络控制调整等离子体位形和加热功率, 从而实现撕裂模的预测性避免. 这些应用也都高度依赖于诊断数据的实时测量. 但是, 这些数据分析技术大多应用于已处于运行稳定期的装置, 在稳定运行的装置中, 神经网络模型的训练集和测试集拥有相似的参数分布. 而中国环流三号HL-3[13]等新装置以及未来的国际热核聚变实验堆(international thermonuclear experimental reactor, ITER)等聚变堆装置, 需要经过从低参数逐渐提升至高参数的过程. 例如, HL-3在2019年的初始放电轮次中仅具有0.1 MA左右的等离子体电流, 而在2020—2022年的实验中, 其等离子体电流逐步提升到了1.0—1.5 MA的范围[14,15], ITER装置同样在物理研究计划中制定了从0.5 keV逐步覆盖到40 keV的芯部离子温度测量需求[16]. 基于低参数区间实验数据开发的算法和模型是否能够有效外推至高参数区间, 以及其外推能力的范围, 直接影响相关数据分析技术在这些装置中的适用性. 因此, 这一问题亟需进一步的研究与探索.

    本文采用神经网络模型对CXRS诊断数据进行分析, 旨在实现离子温度的快速获取, 以满足实时反馈控制的需求. 第2节简要介绍CXRS诊断的原理及其分析方法; 第3节展示神经网络模型的数据库构建、网络结构设计与训练过程, 并对模型输出结果进行详细分析; 第4节评估模型在跨参数区间外推能力方面的表现, 并通过引入高温度区间的合成数据(synthetic data)来提升模型的外推能力. 最后, 第5节对本文的研究工作进行总结并提出讨论.

    CXRS诊断是在中性束注入(neutral beam injection, NBI)条件下, 通过测量高能粒子与等离子体中的热碳离子发生电荷交换复合反应后的粒子退激发产生的特征谱线C VI线(n = 8—7)来获取热离子温度信息, 该反应如下所示:

    D0+C6+D++C5+D++C5++hν, (1)

    其中D0代表中性束粒子; C6+为正6价碳离子; *表示粒子处于激发态; hν代表退激发产生的光, 该特征谱线的静止波长为529.05 nm. 该谱线强度呈现高斯型分布, 通过其多普勒展宽Δλ可得到离子温度, 如下:

    Ti=mc28ln2(Δλ529.05)2. (2)

    式中Ti是以eV为单位的离子温度, m是离子质量, c为光速, Δλ为高斯峰的半高全宽. 由于等离子体中有许多不同的原子、分子反应同时发生, 实际测量的光谱往往包含许多互相覆盖的谱线.

    图1(b)给出了HL-2A装置的CXRS诊断的测量光谱及其解谱结果作为示例. 图1(b1)中, “acx”表示主动CXRS谱, 为测量目标谱线, 其展宽反映局域位置离子温度; “pcx”为被动CXRS谱线, 主要来自等离子体边缘中性分子发生(1)式所示反应; “ei”表示来自电子碰撞激发过程产生的光谱, 其中心波长为529.05 nm, 右侧还有波长为530.46 nm的C III谱线, 后两者的波长基本上保持静止. 作为对比, 图1(b2)给出了一个温度参数较低时的光谱及其分解结果. 对比可见, 随着离子温度增加, 目标谱线展宽增大, 实验测量光谱信号会发生明显变化, 若离子温度进一步提升, 目标谱线还会与C III谱线发生重叠, 进一步加大解谱难度.

    图 1 HL-2A装置CXRS光谱诊断示例 (a) CXRS诊断系统示意图; (b)离子温度为3.1和1.4 keV下光谱及其分解结果\r\nFig. 1. CXRS diagnostic system and measured spectra in HL-2A: (a) Diagram of CXRS diagnostic system; (b) spectra and their decomposition results at ion temperature of 3.1 and 1.4 keV.
    图 1  HL-2A装置CXRS光谱诊断示例 (a) CXRS诊断系统示意图; (b)离子温度为3.1和1.4 keV下光谱及其分解结果
    Fig. 1.  CXRS diagnostic system and measured spectra in HL-2A: (a) Diagram of CXRS diagnostic system; (b) spectra and their decomposition results at ion temperature of 3.1 and 1.4 keV.

    HL-2A的CXRS诊断有32个空间通道[17,18], 观测范围覆盖整个等离子体小截面( r/a=0—1 ), 其结构示意图见图1(a). 光收集系统的视线以接近水平的角度与中性束相交, 光经过传输光纤到达光谱仪, 经过分光后进入一个电荷耦合组件(charge-coupled device, CCD)相机探测器获得光谱测量信号, 该光谱仪在529 nm附近的倒线色散率为0.0117 nm/pixel, 时间分辨率为10—15 ms.

    通常情况下, 假设观测光谱由本底和多个不同的高斯峰组成, 则观测到的光谱强度可以写为N个高斯峰之和:

    I\left(\lambda \right)={I}_{0}+\sum _{i=1}^{N}{a}_{i}{\mathrm{exp}} \bigg[-\frac{{\left(\lambda -{\lambda }_{i}\right)}^{2}}{2{\sigma }_{i}^{2}}\bigg]. (3)

    这里, {I}_{0} 包含背景噪声和韧致辐射产生的连续谱, {\lambda }_{i}, {\sigma }_{i}, {a}_{i} 分别代表第 i 个高斯峰的中心波长、展宽和强度, 数据与拟合值的误差函数为

    E=\sum _{j=1}^{M}\frac{{\left[I\left({\lambda }_{j}\right)-{y}_{j}\right]}^{2}}{{\sigma }_{{\mathrm{p}}{\mathrm{h}},j}^{2}}. (4)

    式中M代表目标范围内的测量值个数, {y}_{j} {\lambda }_{j} 处的测量值, {\sigma }_{{\mathrm{p}}{\mathrm{h}}} 为光子噪声的标准差, 与光强正相关. 通过迭代最小化该误差函数, 可获得光谱的解谱结果.

    针对于实时测量需求, 迭代进行最小二乘拟合的解谱方法主要存在两个问题. 一方面, 迭代最小二乘拟合的方法解一个光谱所需的时间约为100—1000 ms, 难以进行并行加速到实时反馈控制所需的响应时间. 另一方面, 该方法依赖于大量人工经验化的干预. 例如, 使用迭代解谱方法时, 通常需要预先确定好高斯峰的个数, 并为所有待定参数给出合理的初始估计值. 对于一个测量光谱, 往往存在多个不同的参数组合, 这些组合可能都是误差函数的局部最优解. 错误的初始估计值可能导致计算耗时延长, 甚至使得算法收敛到物理上不合理的局部最优解上.

    基于数据驱动的神经网络尤其是深度学习模型, 通过构建多层非线性结构, 可直接从数据中自动学习复杂的输入与输出关系, 提取隐藏的特征模式. 其中, 卷积神经网络(convolutional neural networks, CNN)擅长于捕捉光谱信号中的局部特征, 其在光谱分析中展现出与传统方法截然不同的优越性, 为实现更精确、更快速的分析提供了新方 向[19]. 本节介绍了在HL-2A装置上构建光谱分析神经网络的过程, 及神经网络分析光谱数据的测试表现.

    光谱分析神经网络模型的输入是代表光谱强度的一维序列数据, 其每个数值代表了特定波长区间的光强, 输出是离子温度, 使用通过传统解谱方法得到的结果作为标签. 训练和测试使用的数据集包含了HL-2A装置2019年3月到2021年8月的放电数据中有NBI注入、包含有效CXRS诊断信号及分析结果的部分数据, 共计115炮放电. HL-2A装置典型的NBI加热时长为800 ms, 每炮包含50—100帧有效信号. 而由于不同放电条件下等离子体半径不一样, 当等离子体较小时诊断的边缘通道信号较弱, 无法获得有效的分析结果, 每一炮的有效信号通道数在15—30之间. 最终累积的数据集的总光谱个数为12.2×104. 图2展示了数据集的离子温度分布, 由图可见, 数据集中离子温度主要分布在1.8 keV以下, 大于2 keV的高温度数据占比很小, 数据分布有较强的不平衡特性.

    图 2 数据集的离子温度分布\r\nFig. 2. Distribution of ion temperature in the whole dataset.
    图 2  数据集的离子温度分布
    Fig. 2.  Distribution of ion temperature in the whole dataset.

    这一数据集将被划分为训练集和测试集, 前者用于训练模型的参数, 而后者用于对训练完成的模型进行性能评估. 本节仅使用小于2 keV的数据进行模型训练和测试, 该部分数据量约为11.6×104, 通过随机划分的方式, 以8∶2的比例分配至训练集和测试集, 用来评估模型的性能表现. 在下一节中将对该模型外推到2—4 keV的参数区间的能力进行评估和研究.

    在用于训练模型之前, 对训练集的数据进行z分数标准化[20], 即

    {x}'= (x-{\overline{x}}_{\rm train})/\sigma_{\rm train}, (5)

    其中 x x' 分别代表原始输入数据和标准化输入数据; {\overline{x}}_{{\mathrm{t}}{\mathrm{r}}{\mathrm{a}}{\mathrm{i}}{\mathrm{n}}} {\sigma }_{{\mathrm{t}}{\mathrm{r}}{\mathrm{a}}{\mathrm{i}}{\mathrm{n}}} 分别代表训练集上模型输入的平均值和标准差. 该标准化操作有助于提高训练过程的稳定性.

    本研究中采用平均相对误差(MRE)和拟合优度 {R}^{2} 作为模型性能评估指标.

    {\mathrm{MRE}}=\frac{1}{N}\sum _{i=1}^{N}\left|\frac{{y}_{i}-{\widehat{y}}_{i}}{{y}_{i}}\right|, (6)
    {R}^{2}=1-\frac{\displaystyle\sum\nolimits_{i}{\left({y}_{i}-{\widehat{y}}_{i}\right)}^{2}}{\displaystyle\sum \nolimits_{i}{\left({y}_{i}-\overline{y}\right)}^{2}}, (7)

    其中 {y}_{i} 代表标签值, {\widehat{y}}_{i} 为模型输出值. MRE的 值越小, R2越接近于1, 说明模型的输出越接近标签值.

    2.1节对光谱解谱过程的介绍中, 可以看出离子温度的计算依赖于对光谱中某些结构化的谱线特征的提取. 针对这一特点, 本研究采用基于卷积神经网络的模型. 单个卷积神经网络层的计算原理可以用(8)式表达:

    {\boldsymbol{Y}} (i,m) = \sum _{n=1}^{N}\sum _{j=1}^{J}\boldsymbol{W} (m,n,j) \boldsymbol{X} (i + n,j) + \boldsymbol{B} (m), (8)

    其中X是一个尺寸为I×J的二维矩阵, 由原始输入数据或前一神经网络层的输出构成, I表示输入的宽度, J表示特征的通道数. 这一输入将由M个宽度为N的卷积核分别进行特征提取, 卷积核的权重用WB矩阵表示, 其尺寸分别为M×N×JM. 当输入中出现与某个卷积核的权重相似的波形结构时, 卷积输出Y的数值将会明显增大. 而卷积神经网络会在训练过程中逐步调整权重矩阵的数值, 最终实现提取目标的波形结构特征的效果. 这一特点使其比全连接神经网络、循环神经网络等常见神经网络结构更适合用于对光谱数据进行分析. 在总体采用卷积神经网络架构的指导思想下, 本研究主要参考了一维版本的ResNet结构进行模型设计[21,22], 模型结构及每层的输出尺寸如图3所示, 其中实线箭头代表残差连接, 其能够通过缓解梯度消失来增强模型训练过程的稳定性. 在每个卷积层的特征提取计算后, 会紧跟一个激活函数来对输出矩阵进行一次非线性变换, 为神经网络引入一定的非线性拟合能力.

    图 3 神经网络模型结构, 其中实线箭头连接的地方表示残差连接\r\nFig. 3. Architecture of the CNN-based model, where the solid arrow is connected, the residual connection is represented.
    图 3  神经网络模型结构, 其中实线箭头连接的地方表示残差连接
    Fig. 3.  Architecture of the CNN-based model, where the solid arrow is connected, the residual connection is represented.

    此外, 在特定的神经网络层后, 也会对输出矩阵进行一次池化计算, 每隔一个池化步长, 便提取附近池化宽度范围内的最大输出特征来作为新的特征矩阵的输出. 这一做法使得特征矩阵的尺寸逐步减少, 对特征的提取从局部逐步变得全局化. 所有卷积层的核数量、核尺寸、步长、池化参数等都在表1[23]列出. 经过11个CNN层后通过全连接层最终获得离子温度输出.

    表 1  CNN层的参数配置
    Table 1.  Configuration of the CNN layers.
    编号核数量核宽度激活函数池化池化步长池化宽度
    1323gelu[23]
    2323最大22
    3323
    4323
    5643最大22
    6643
    7643
    81285最大22
    91283
    101283
    111283最大全局
    下载: 导出CSV 
    | 显示表格

    模型训练过程中主要采用的超参数简要介绍如下. 首先, 对归一化后的输入数据添加了高斯分布的噪声(Gaussian noise), 这是一种有效的数据增强技术, 能够提高模型的鲁棒性和泛化能力, 相关参数设置见表2第一行; 训练过程中, 通过Adam优化器[24]将预测误差对神经网络权重的偏导数映射到权重的调整值, 训练的第 i 步的学习率为 0.001\times {\left(0.1\right)}^{i/30000} ; 为减少模型过拟合, 每一步训练后, 对网络设置权重衰减(weight decay)以避免出现过大的权重, 第 i 步衰减权重为 0.0003\times {\left(0.1\right)}^{i/50000} ; 模型的损失函数(loss function)为平均绝对误差, 也可采用平均相对误差作为损失函数, 研究中发现采用二者表现基本相当; 其余相关超参数设置及说明由表2给出, 整个模型搭建和训练的过程使用开源深度学习框架Tensorflow完成.

    表 2  模型训练过程的超参数配置及相关说明
    Table 2.  Hyper-parameters and related explanation of the CNN-based model.
    参数(英文名)说明
    高斯噪声(Gaussian noise)μ = 0, σ = 0.01添加高斯噪声对训练集进行数据增强
    批次尺寸(Batch size)128随机梯度下降过程中的批次数据个数
    早停机制(Early stopping)20经过一定轮次的训练若效果不再提升则视为训练完成
    神经元屏蔽(Dropout)0.2全连接层中神经元输出在训练过程中随机置零的比例, 以减少过拟合
    下载: 导出CSV 
    | 显示表格

    经过训练收敛后, 将模型在测试集上的表现进行评估. 图4展示了神经网络模型在离子温度0—2 keV区间数据集的标签-预测值散点图, 黑色虚线为横坐标与纵坐标值相等的线. 表3第1行列出了模型性能评估指标和单光谱计算耗时, {R}^{2} 达到0.92, MRE为14%. 图5(a)图5(b)分别展示了离子温度的标签值与模型预测值不同时刻的剖面对比和不同位置的时间演化对比. 可以看到, 模型的预测结果与标签结果虽然存在一定的数值误差, 但具有一致的剖面形状与随时间演化的趋势, 这表明在低离子温度参数区间, 该神经网络模型能够给出较为准确的离子温度并支持对温度的反馈控制. 另一方面, 在普通台式电脑上(CPU型号为i7-14700KF, GPU型号为 NVIDIA RTX 4070TiS), 该模型在推理阶段单光谱计算耗时在1 ms内, 相比迭代解谱方法耗时减少100—1000倍, 并显著小于国际主要聚变装置的能量约束时间[25], 能够满足聚变装置反馈控制的要求.

    图 4 神经网络模型的标签与预测值散点图, 图中黑色虚线为横坐标与纵坐标值相等的线\r\nFig. 4. The scatter plot of label and output of the CNN-based model, the black dotted line in the figure is the line where the horizontal coordinate and the vertical coordinate are equal.
    图 4  神经网络模型的标签与预测值散点图, 图中黑色虚线为横坐标与纵坐标值相等的线
    Fig. 4.  The scatter plot of label and output of the CNN-based model, the black dotted line in the figure is the line where the horizontal coordinate and the vertical coordinate are equal.
    表 3  模型的拟合效果及速度评估
    Table 3.  Performance of the model.
    训练集 测试集/keV {R}^{2} MRE 推理耗时/(ms·单光谱–1)
    无合成数据 0—2 0.92 14% 0.59(平均值) 0.67(99%)
    无合成数据 0—4 0.86 15%
    有合成数据 0—4 0.93 13%
    下载: 导出CSV 
    | 显示表格
    图 5 神经网络模型的标签与预测结果对比 (a)标签与预测离子温度不同时刻剖面对比; (b)标签与预测离子温度不同位置时间演化对比\r\nFig. 5. The label against the output ion temperature of the CNN-based model: (a) Ti profiles in different time; (b) time evolution of Ti at different radius.
    图 5  神经网络模型的标签与预测结果对比 (a)标签与预测离子温度不同时刻剖面对比; (b)标签与预测离子温度不同位置时间演化对比
    Fig. 5.  The label against the output ion temperature of the CNN-based model: (a) Ti profiles in different time; (b) time evolution of Ti at different radius.

    通过归因方法能够对神经网络模型进行可解释性分析. 积分梯度(integrated gradient, IG)方法[26]能够定量化展示模型输出对输入的每一个维度的依赖关系, 该方法计算了从基线输入 x' 到真实输入 x 的直线路径上各点的梯度, 并将这些梯度的路径积分定义为积分梯度. 对于输入的第 i 个像素的数值 {x}_{i} , 积分梯度可表示为

    {\mathrm{I}}{{\mathrm{G}}}_{i} (x) = ({x}_{i}-{x}_{i}' ) \int _{0}^{1}\frac{\partial F ({x}'+\alpha (x-{x}' ))}{\partial {x}_{i}}{\mathrm{d}}\alpha , (9)

    其中 F\left(x\right) 代表神经网络模型; \alpha \in \left[{\mathrm{0, 1}}\right] 是积分路径指数. 本研究中将基线选取为光谱数据的连续谱及噪声构成的基底部分. 对于输入 x , 若 {\mathrm{I}}{{\mathrm{G}}}_{i} (x) > 0 , 代表第 i 个像素的数值 {x}_{i} 与模型输出结果正相关. 若 {\mathrm{I}}{{\mathrm{G}}}_{i} (x) < 0 , 代表 {x}_{i} 与模型输出结果负相关.

    图6展示了放电炮号34339在810 ms时刻通道1的测量光谱数据及其对应的IG曲线作为示例. 该光谱为NBI刚注入时的数据, 其pcx和acx在波长上难以进行区分, 在进行可解释分析时可将它们看作一个高斯峰, 从而得到更加清晰的分析结果. 从图6(b)可以看到, 高斯峰所在的区域对应的IG曲线绝对值较大, 如图中阴影区所示, 而远离acx峰的区域的IG都接近于0, 说明模型对该谱线的响应主要取决于高斯峰区域的输入. 阴影区中IG曲线呈现“M”型, 即包含两个 {\mathrm{I}}{\mathrm{G}} > 0 的峰(对应图中标记“①”和“③”)和两者之间 {\mathrm{I}}{\mathrm{G}} < 0 的谷(图中标记“②”). 对比图6(a)图6(b)可见, 两个峰对应于高斯峰的两腰位置, 该位置的光谱强度增大会使得高斯峰的半高宽增大, 对应于离子温度增加, 与 {\mathrm{I}}{\mathrm{G}} > 0 吻合; 而谷对应于高斯峰的最大值位置, 该位置的光谱强度增大会使得高斯峰的半高全宽减小, 对应于离子温度减小, 与 {\mathrm{I}}{\mathrm{G}} < 0 吻合. 由此可见, 该神经网络模型是通过识别光谱中对应谱线的展宽来推断离子温度的, 与2.1节中介绍的原理一致.

    图 6 光谱曲线及对应的IG曲线(炮号34339, 810 ms). 神经网络对输入的IG曲线呈现近似“M”型, 且与高斯峰的位置准确吻合, 呈现出检测高斯峰的行为\r\nFig. 6. The spectrum and IG graph of the spectrum in 810 ms of shot No. 34339. The neural network presents an approximate “M” shape to the input IG curve, and it is exactly consistent with the position of the Gaussian peak, showing the behavior of detecting the Gaussian peak
    图 6  光谱曲线及对应的IG曲线(炮号34339, 810 ms). 神经网络对输入的IG曲线呈现近似“M”型, 且与高斯峰的位置准确吻合, 呈现出检测高斯峰的行为
    Fig. 6.  The spectrum and IG graph of the spectrum in 810 ms of shot No. 34339. The neural network presents an approximate “M” shape to the input IG curve, and it is exactly consistent with the position of the Gaussian peak, showing the behavior of detecting the Gaussian peak

    综合本节的研究结果可见, 基于数据驱动的光谱诊断分析模型具有替代传统迭代解谱方法, 用于等离子体实时反馈控制的潜力. 然而, 对于基于数据驱动的神经网络算法, 不平衡的数据分布会导致模型向高占比的数据偏置, 从而导致模型在高离子温度下性能不佳. 在此基础上, 模型在向更高温度外推时, 其性能可能会显著下降. 而高温度参数往往是来自于更靠近芯部的通道, 这些参数对于等离子体性能评估的重要性大于边缘的离子温度. 因此, 神经网络模型在高温度区间的外推能力仍需进一步研究和优化.

    将第3节训练的模型在高离子温度的数据上进行测试来评估该模型的外推表现. 图7展示了使用离子温度Ti在0—2 keV区间的数据集训练的神经网络模型外推到2—4 keV的表现, 可以明显地看到, 当离子温度大于2 keV时, 模型预测值开始偏离黑色虚线, 温度越高偏离程度越大, 且预测温度始终没有大于2.5 keV, 出现预测值饱和的现象. 模型在0—4 keV的数据集上拟合优度系数 {R}^{2} 为0.86, 在外推区间拟合效果较差, 具体见表3的第2行. 这说明该模型往高温度外推的能力非常有限.

    图 7 Ti在0—2 keV参数区间训练的神经网络模型外推到更高温度参数区间的表现\r\nFig. 7. Performance of the CNN-based model trained on dataset with Ti in 0–2 keV on test set in higher Ti range.
    图 7  Ti在0—2 keV参数区间训练的神经网络模型外推到更高温度参数区间的表现
    Fig. 7.  Performance of the CNN-based model trained on dataset with Ti in 0–2 keV on test set in higher Ti range.

    根据第2节的介绍, 实验中测量获得的谱线由多个部分组成, 包括有效的acx峰, 光子噪声, 以及对解谱带来较大干扰的pcx峰和ei峰. 后两者的变化主要与等离子体边缘的状态变化有关, 而光子噪声是随机的, 原理上都与acx峰无直接耦合关系. 因此, 可以通过测量谱线分解得到的几部分“干扰”信号, 叠加上根据已知的目标温度算出的合成acx峰, 获得对应目标温度的合成光谱数据. 若忽略由于温度(光强)增加带来的部分像素点光子噪声增加, 该合成谱线在物理上是可能存在的.

    根据(3)式展示的光谱的构建形式, 再结合(2)式, 可以通过低温度的光谱测量数据生成更高温度下光谱的合成数据. 具体而言, 选取一个实验测量谱线作为模板, 拟合分解出各个谱线, 再根据(3)式将测量谱线减去拟合acx峰得到谱线残余. 根据更高的离子温度的条件, 可以合成展宽更大的新的acx峰. 通过将合成的acx峰强度设置为与模板acx峰相同, 结合谱线残余, 便可得到对应更高离子温度的合成谱线. 需要指出的是, 本研究中设置acx峰的幅值与模板相同主要是出于简化操作考虑. 研究中尝试将其幅值在模板幅值的50%—200%之间随机变化, 发现其对结果无显著影响. 在实际实验中, 影响acx峰强度的因素较为复杂, 更精确的描述需要诸多因素, 这一内容超出了本研究的范畴. 图8展示了合成过程的流程图, 以及根据 {T}_{{\mathrm{i}}}\approx 1.5\;{\mathrm{k}}{\mathrm{e}}{\mathrm{V}} 的测量谱线得到的 {T}_{{\mathrm{i}}} 2.2\;{\mathrm{k}}{\mathrm{e}}{\mathrm{V}} 2.6\;{\mathrm{k}}{\mathrm{e}}{\mathrm{V}} 的合成谱线.

    图 8 合成谱线的流程图及谱线示例.\r\nFig. 8. Examples of synthetic spectrum, along with the flow chart of the synthesizing process.
    图 8  合成谱线的流程图及谱线示例.
    Fig. 8.  Examples of synthetic spectrum, along with the flow chart of the synthesizing process.

    选取30个 {T}_{{\mathrm{i}}} 在1.5—2 keV区间的测量光谱作为模板, 生成大约4200个 {T}_{{\mathrm{i}}} 在2—3 keV区间的合成光谱, 其数量约为训练集数据量的5%. 将其随机混合到3.1节所述的训练集中用于模型训练, 并在 {T}_{{\mathrm{i}}} 包含0—4 keV的测试集里进行评估. 该模型的离子温度标签值和预测值的散点图如图9所示. 对比图7, 可看到加上合成数据的模型的预测温度并未出现饱和现象, 在外推温度区间内散点图集中在黑色虚线附近. 根据表3第3行可见, 训练集包含合成数据的模型在0—4 keV的数据集上 {R}^{2} 达到0.93, 外推效果远好于不包含合成数据的模型. 图10展示了有、无合成数据的模型的平均相对误差MRE随着离子温度参数区间增大的变化情况. 其中黑色圆点表示无合成数据的模型, 在离子温度超过2 keV之后, MRE大幅增加, 并且随着温度离训练集参数区间变远而不断增大. 红色菱形代表有合成数据的模型, 从图10可以看到, 添加合成数据到训练集降低了所有参数区间的MRE, 其中, 模型在离子温度为2—3 keV的表现甚至优于拥有大量真实训练数据的低温度区间, 在3—4 keV区间的MRE也从35%降低到小于15%, 最终表现与低温度区间接近.

    图 9 $ {T}_{{\mathrm{i}}} $在0—2 keV区间训练的神经网络模型外推到更高温度参数区间的表现\r\nFig. 9. Performance of the CNN-based model trained on dataset with $ {T}_{{\mathrm{i}}} $ between 0–2 keV on data with higher $ {T}_{{\mathrm{i}}} $.
    图 9  {T}_{{\mathrm{i}}} 在0—2 keV区间训练的神经网络模型外推到更高温度参数区间的表现
    Fig. 9.  Performance of the CNN-based model trained on dataset with {T}_{{\mathrm{i}}} between 0–2 keV on data with higher {T}_{{\mathrm{i}}} .
    图 10 训练集有、无合成训练数据的神经网络模型在不同离子温度区间的平均相对误差MRE表现对比\r\nFig. 10. Comparison of the MRE in various $ {T}_{{\mathrm{i}}} $ ranges of CNN-based models w/ or w/o synthetic training data.
    图 10  训练集有、无合成训练数据的神经网络模型在不同离子温度区间的平均相对误差MRE表现对比
    Fig. 10.  Comparison of the MRE in various {T}_{{\mathrm{i}}} ranges of CNN-based models w/ or w/o synthetic training data.

    在未包含合成数据的情况下, 神经网络中存在的激活函数层、池化层等存在饱和机制的组件, 在面对超出训练集参数区间的数据时, 可能会出现大范围失效的情况, 从而导致出现如图7所示, 模型对高于2 keV的测试数据的输出全都饱和的现象. 而合成数据的引入可以促使神经网络对权重的分布进行一定的调整, 以提前适应新参数区间的输入数据. 同时, 由于合成数据的构造方法是按照合理的解谱逻辑构建的, 它不会破坏原有神经网络学习到的映射规律, 从而能够支撑模型在新的参数区间内进行合理的外推.

    综上, 通过在训练集内添加5%的基于低温度区间的合成数据, 可以将模型可适用的参数区间从0—2 keV扩大到0—4 keV, 增大了一倍. 可见, 通过添加少量合成数据到训练集的方式可以改善模型的分析效果, 并且大幅增强神经网络模型的跨参数区间外推能力.

    本文针对磁约束聚变装置等离子体实时反馈控制对离子温度参数快速测量的需求, 提出了一种基于卷积神经网络的模型, 旨在实现对传统迭代解谱算法的完全替代, 并对神经网络模型在跨参数区间的外推能力方面进行研究. 研究结果表明, 基于卷积神经网络的模型能够有效地分析离子温度, 并将推理阶段单光谱计算耗时压缩到小于1 ms, 较传统解谱方法减少100—1000倍. 然而, 基于数据驱动的神经网络模型面临数据量不足、数据分布不平衡等问题, 导致其在高温度区间的外推能力几乎为零. 为解决这一问题, 本研究基于低温度区间的实验测量数据构建了高温度区间的合成数据, 通过向训练集中添加5%的合成数据, 显著提高了模型分析性能, 并将模型可适用的参数区间从0—2 keV扩大到0—4 keV.

    本工作使用了简化的合成数据的办法, 忽略了实际实验中等离子体温度提升后对光谱信号带来的综合影响. 针对这一个问题后续可在两个方向进行改进, 一方面, 结合数据库中光谱分解信号之间幅值、展宽等特征的统计关系, 采用符合统计关系的方式生成更合理的合成数据; 另一方面, 结合模拟程序更好地提供更高温度下光谱强度的合成数据. 更多相关工作还有待开展.

    这项研究证明了在磁约束核聚变领域利用合成数据提升人工智能算法性能的可行性, 为未来高参数磁约束聚变装置进行实时的离子温度测量与反馈控制算法开发提供了重要参考价值, 也为基于机器学习方法的破裂预测、撕裂模控制等对跨装置性能有高要求的研究打下了坚实的基础.

    感谢核工业西南物理研究院高性能计算平台的支持, 以及核工业西南物理研究院刘亮、魏彦玲、徐欣亮、李栋及HL-2A团队对本文工作的贡献.

    [1]

    Lister J B, Bruzzone P L, Costley A E, et al. 2000 Nucl. Fusion 40 1167Google Scholar

    [2]

    Gormezano C, Sips A C C, Luce T C, et al. 2007 Nucl. Fusion 47 S285Google Scholar

    [3]

    Hellermann M G V, Mandl W, Summers H P, Weisen H, Wolf R 1990 Rev. Sci. Instrum. 61 3479Google Scholar

    [4]

    Seraydarian R P, Burrell K H 1986 Rev. Sci. Instrum. 57 2012Google Scholar

    [5]

    何小雪, 陈文锦, 魏彦玲, 刘亮, 王诗琴, 余德良 2024 核聚变与等离子体物理 44 477Google Scholar

    He X X, Chen W J, Wei Y L, Liu L, Wang S Q, Yu D L 2024 Nucl. Fusion Plasma Phys. 44 477Google Scholar

    [6]

    张镱 2015 硕士学位论文(合肥: 中国科学技术大学)

    Zhang Y 2015 M. S. Thesis (Hefei: University of Science and Technology of China

    [7]

    Svensson J, Hellermann M V, König R W T 1999 Plasma Phys. Controlled Fusion 41 315Google Scholar

    [8]

    Bishop C M, Roach C M 1992 Rev. Sci. Instrum. 63 4450Google Scholar

    [9]

    Abbate J, Conlin R, Kolemen E 2021 Nucl. Fusion 61 046027Google Scholar

    [10]

    Zheng G H, Yang Z Y, Liu S F, Ma R, Gong X W, Wang A, Wang S, Zhong W L 2024 Nucl. Fusion 64 126041Google Scholar

    [11]

    Yang Z, Xia F, Song X, Gao Z, Wang S, Dong Y 2021 Nucl. Fusion 61 126042Google Scholar

    [12]

    Yang Z, Xia F, Song X, et al. 2022 Fusion Eng. Des. 182 113223Google Scholar

    [13]

    Seo J, Kim S, Jalalvand A, et al. 2024 Nature 626 8000Google Scholar

    [14]

    Duan X R, Xu M, Zhong W L, et al. 2024 Nucl. Fusion 64 112021Google Scholar

    [15]

    Duan X R, Xu M, Zhong W L, et al. 2022 Nucl. Fusion 62 042020Google Scholar

    [16]

    Donné A J H, Costley A E, Barnsley R, et al. 2007 Nucl. Fusion 47 S337Google Scholar

    [17]

    Wei Y L, Yu D L, Liu L, et al. 2014 Rev. Sci. Instrum. 85 103503Google Scholar

    [18]

    He X X, Yu D L, Yan L W, et al. 2020 Rev. Sci. Instrum. 91 053504Google Scholar

    [19]

    王彦飞, 朱悉铭, 张明志, 孟圣峰, 贾军伟, 柴昊, 王旸, 宁中喜 2021 物理学报 70 095211Google Scholar

    Wang Y F, Zhu X M, Zhang M Z, Meng S F, Jia J W, Chai H, Wang Y, Ning Z X 2021 Acta Phys. Sin. 70 095211Google Scholar

    [20]

    Fei N Y, Gao Y Z, Lu Z W, Xiang T 2021 2021 IEEE/CVF International Conference on Computer Vision Electric Network, October 11–17, 2021 pp142–151

    [21]

    He K M, Zhang X Y, Ren S Q, Sun J 2016 IEEE Conference on Computer Vision and Pattern Recognition Las Vegas, June 27–30, 2016 pp770–778

    [22]

    He M, Yang Z, Liu S, Xia F, Zhong W 2024 Plasma Phys. Controlled Fusion 66 105019Google Scholar

    [23]

    Hendrycks D, Gimpel K 2016 arXiv: 1606.08415 [cs. LG]

    [24]

    Loshchilov I, Hutter F 2017 arXiv: 1711.05101 [cs. LG]

    [25]

    Yushmanov P N, Takizuka T, Riedel K S, Kardaun O J W F, Cordey J G, Kaye S M, Post D E 1990 Nucl. Fusion 30 1999Google Scholar

    [26]

    Sundararajan M, Taly A, Yan Q 2017 arXiv: 1703.01365 [cs. LG]

  • 图 1  HL-2A装置CXRS光谱诊断示例 (a) CXRS诊断系统示意图; (b)离子温度为3.1和1.4 keV下光谱及其分解结果

    Fig. 1.  CXRS diagnostic system and measured spectra in HL-2A: (a) Diagram of CXRS diagnostic system; (b) spectra and their decomposition results at ion temperature of 3.1 and 1.4 keV.

    图 2  数据集的离子温度分布

    Fig. 2.  Distribution of ion temperature in the whole dataset.

    图 3  神经网络模型结构, 其中实线箭头连接的地方表示残差连接

    Fig. 3.  Architecture of the CNN-based model, where the solid arrow is connected, the residual connection is represented.

    图 4  神经网络模型的标签与预测值散点图, 图中黑色虚线为横坐标与纵坐标值相等的线

    Fig. 4.  The scatter plot of label and output of the CNN-based model, the black dotted line in the figure is the line where the horizontal coordinate and the vertical coordinate are equal.

    图 5  神经网络模型的标签与预测结果对比 (a)标签与预测离子温度不同时刻剖面对比; (b)标签与预测离子温度不同位置时间演化对比

    Fig. 5.  The label against the output ion temperature of the CNN-based model: (a) Ti profiles in different time; (b) time evolution of Ti at different radius.

    图 6  光谱曲线及对应的IG曲线(炮号34339, 810 ms). 神经网络对输入的IG曲线呈现近似“M”型, 且与高斯峰的位置准确吻合, 呈现出检测高斯峰的行为

    Fig. 6.  The spectrum and IG graph of the spectrum in 810 ms of shot No. 34339. The neural network presents an approximate “M” shape to the input IG curve, and it is exactly consistent with the position of the Gaussian peak, showing the behavior of detecting the Gaussian peak

    图 7  Ti在0—2 keV参数区间训练的神经网络模型外推到更高温度参数区间的表现

    Fig. 7.  Performance of the CNN-based model trained on dataset with Ti in 0–2 keV on test set in higher Ti range.

    图 8  合成谱线的流程图及谱线示例.

    Fig. 8.  Examples of synthetic spectrum, along with the flow chart of the synthesizing process.

    图 9  {T}_{{\mathrm{i}}} 在0—2 keV区间训练的神经网络模型外推到更高温度参数区间的表现

    Fig. 9.  Performance of the CNN-based model trained on dataset with {T}_{{\mathrm{i}}} between 0–2 keV on data with higher {T}_{{\mathrm{i}}} .

    图 10  训练集有、无合成训练数据的神经网络模型在不同离子温度区间的平均相对误差MRE表现对比

    Fig. 10.  Comparison of the MRE in various {T}_{{\mathrm{i}}} ranges of CNN-based models w/ or w/o synthetic training data.

    表 1  CNN层的参数配置

    Table 1.  Configuration of the CNN layers.

    编号核数量核宽度激活函数池化池化步长池化宽度
    1323gelu[23]
    2323最大22
    3323
    4323
    5643最大22
    6643
    7643
    81285最大22
    91283
    101283
    111283最大全局
    下载: 导出CSV

    表 2  模型训练过程的超参数配置及相关说明

    Table 2.  Hyper-parameters and related explanation of the CNN-based model.

    参数(英文名)说明
    高斯噪声(Gaussian noise)μ = 0, σ = 0.01添加高斯噪声对训练集进行数据增强
    批次尺寸(Batch size)128随机梯度下降过程中的批次数据个数
    早停机制(Early stopping)20经过一定轮次的训练若效果不再提升则视为训练完成
    神经元屏蔽(Dropout)0.2全连接层中神经元输出在训练过程中随机置零的比例, 以减少过拟合
    下载: 导出CSV

    表 3  模型的拟合效果及速度评估

    Table 3.  Performance of the model.

    训练集 测试集/keV {R}^{2} MRE 推理耗时/(ms·单光谱–1)
    无合成数据 0—2 0.92 14% 0.59(平均值) 0.67(99%)
    无合成数据 0—4 0.86 15%
    有合成数据 0—4 0.93 13%
    下载: 导出CSV
  • [1]

    Lister J B, Bruzzone P L, Costley A E, et al. 2000 Nucl. Fusion 40 1167Google Scholar

    [2]

    Gormezano C, Sips A C C, Luce T C, et al. 2007 Nucl. Fusion 47 S285Google Scholar

    [3]

    Hellermann M G V, Mandl W, Summers H P, Weisen H, Wolf R 1990 Rev. Sci. Instrum. 61 3479Google Scholar

    [4]

    Seraydarian R P, Burrell K H 1986 Rev. Sci. Instrum. 57 2012Google Scholar

    [5]

    何小雪, 陈文锦, 魏彦玲, 刘亮, 王诗琴, 余德良 2024 核聚变与等离子体物理 44 477Google Scholar

    He X X, Chen W J, Wei Y L, Liu L, Wang S Q, Yu D L 2024 Nucl. Fusion Plasma Phys. 44 477Google Scholar

    [6]

    张镱 2015 硕士学位论文(合肥: 中国科学技术大学)

    Zhang Y 2015 M. S. Thesis (Hefei: University of Science and Technology of China

    [7]

    Svensson J, Hellermann M V, König R W T 1999 Plasma Phys. Controlled Fusion 41 315Google Scholar

    [8]

    Bishop C M, Roach C M 1992 Rev. Sci. Instrum. 63 4450Google Scholar

    [9]

    Abbate J, Conlin R, Kolemen E 2021 Nucl. Fusion 61 046027Google Scholar

    [10]

    Zheng G H, Yang Z Y, Liu S F, Ma R, Gong X W, Wang A, Wang S, Zhong W L 2024 Nucl. Fusion 64 126041Google Scholar

    [11]

    Yang Z, Xia F, Song X, Gao Z, Wang S, Dong Y 2021 Nucl. Fusion 61 126042Google Scholar

    [12]

    Yang Z, Xia F, Song X, et al. 2022 Fusion Eng. Des. 182 113223Google Scholar

    [13]

    Seo J, Kim S, Jalalvand A, et al. 2024 Nature 626 8000Google Scholar

    [14]

    Duan X R, Xu M, Zhong W L, et al. 2024 Nucl. Fusion 64 112021Google Scholar

    [15]

    Duan X R, Xu M, Zhong W L, et al. 2022 Nucl. Fusion 62 042020Google Scholar

    [16]

    Donné A J H, Costley A E, Barnsley R, et al. 2007 Nucl. Fusion 47 S337Google Scholar

    [17]

    Wei Y L, Yu D L, Liu L, et al. 2014 Rev. Sci. Instrum. 85 103503Google Scholar

    [18]

    He X X, Yu D L, Yan L W, et al. 2020 Rev. Sci. Instrum. 91 053504Google Scholar

    [19]

    王彦飞, 朱悉铭, 张明志, 孟圣峰, 贾军伟, 柴昊, 王旸, 宁中喜 2021 物理学报 70 095211Google Scholar

    Wang Y F, Zhu X M, Zhang M Z, Meng S F, Jia J W, Chai H, Wang Y, Ning Z X 2021 Acta Phys. Sin. 70 095211Google Scholar

    [20]

    Fei N Y, Gao Y Z, Lu Z W, Xiang T 2021 2021 IEEE/CVF International Conference on Computer Vision Electric Network, October 11–17, 2021 pp142–151

    [21]

    He K M, Zhang X Y, Ren S Q, Sun J 2016 IEEE Conference on Computer Vision and Pattern Recognition Las Vegas, June 27–30, 2016 pp770–778

    [22]

    He M, Yang Z, Liu S, Xia F, Zhong W 2024 Plasma Phys. Controlled Fusion 66 105019Google Scholar

    [23]

    Hendrycks D, Gimpel K 2016 arXiv: 1606.08415 [cs. LG]

    [24]

    Loshchilov I, Hutter F 2017 arXiv: 1711.05101 [cs. LG]

    [25]

    Yushmanov P N, Takizuka T, Riedel K S, Kardaun O J W F, Cordey J G, Kaye S M, Post D E 1990 Nucl. Fusion 30 1999Google Scholar

    [26]

    Sundararajan M, Taly A, Yan Q 2017 arXiv: 1703.01365 [cs. LG]

  • [1] 刘坤, 项红甫, 周雄峰, 夏昊天, 李华. 固定功率下大气压交流氩气等离子体射流的光谱特性. 物理学报, 2023, 72(11): 115201. doi: 10.7498/aps.72.20230307
    [2] 方波浪, 王建国, 冯国斌. 基于物理信息神经网络的光斑质心计算. 物理学报, 2022, 71(20): 200601. doi: 10.7498/aps.71.20220670
    [3] 刘国荣, 朱维君, 褚润通, 王伟, 袁萍, 安婷婷, 万瑞斌, 孙对兄, 马云云, 郭志艳. 依据不同波段光谱诊断闪电回击通道温度. 物理学报, 2022, 71(10): 109201. doi: 10.7498/aps.71.20211673
    [4] 魏德志, 陈福集, 郑小雪. 基于混沌理论和改进径向基函数神经网络的网络舆情预测方法. 物理学报, 2015, 64(11): 110503. doi: 10.7498/aps.64.110503
    [5] 刘玉峰, 张连水, 和万霖, 黄宇, 杜艳君, 蓝丽娟, 丁艳军, 彭志敏. 激光诱导击穿火焰等离子体光谱研究. 物理学报, 2015, 64(4): 045202. doi: 10.7498/aps.64.045202
    [6] 梁亦寒, 胡广月, 袁鹏, 王雨林, 赵斌, 宋法伦, 陆全明, 郑坚. 纳秒激光烧蚀固体靶产生的等离子体在外加横向磁场中膨胀时的温度和密度参数演化. 物理学报, 2015, 64(12): 125204. doi: 10.7498/aps.64.125204
    [7] 刘玉峰, 丁艳军, 彭志敏, 黄宇, 杜艳君. 激光诱导击穿空气等离子体时间分辨特性的光谱研究. 物理学报, 2014, 63(20): 205205. doi: 10.7498/aps.63.205205
    [8] 高启, 张传飞, 周林, 李正宏, 吴泽清, 雷雨, 章春来, 祖小涛. Z箍缩Al等离子体X辐射谱线的分离及电子温度的提取. 物理学报, 2014, 63(9): 095201. doi: 10.7498/aps.63.095201
    [9] 陈铁明, 蒋融融. 混沌映射和神经网络互扰的新型复合流密码. 物理学报, 2013, 62(4): 040301. doi: 10.7498/aps.62.040301
    [10] 李华青, 廖晓峰, 黄宏宇. 基于神经网络和滑模控制的不确定混沌系统同步. 物理学报, 2011, 60(2): 020512. doi: 10.7498/aps.60.020512
    [11] 高勋, 宋晓伟, 郭凯敏, 陶海岩, 林景全. 飞秒激光烧蚀硅表面产生等离子体的发射光谱研究. 物理学报, 2011, 60(2): 025203. doi: 10.7498/aps.60.025203
    [12] 蒲昱东, 杨家敏, 靳奉涛, 张璐, 丁永坤. 辐射输运实验中的Al等离子体发射光谱研究. 物理学报, 2011, 60(4): 045210. doi: 10.7498/aps.60.045210
    [13] 赵海全, 张家树. 混沌通信系统中非线性信道的自适应组合神经网络均衡. 物理学报, 2008, 57(7): 3996-4006. doi: 10.7498/aps.57.3996
    [14] 王永生, 孙 瑾, 王昌金, 范洪达. 变参数混沌时间序列的神经网络预测研究. 物理学报, 2008, 57(10): 6120-6131. doi: 10.7498/aps.57.6120
    [15] 王瑞敏, 赵 鸿. 神经元传输函数对人工神经网络动力学特性的影响. 物理学报, 2007, 56(2): 730-739. doi: 10.7498/aps.56.730
    [16] 王耀南, 谭 文. 混沌系统的遗传神经网络控制. 物理学报, 2003, 52(11): 2723-2728. doi: 10.7498/aps.52.2723
    [17] 谭文, 王耀南, 刘祖润, 周少武. 非线性系统混沌运动的神经网络控制. 物理学报, 2002, 51(11): 2463-2466. doi: 10.7498/aps.51.2463
    [18] 傅喜泉, 刘承宜, 郭弘. 等离子体中X射线激光传输与电子密度诊断的理论及数值比较. 物理学报, 2002, 51(6): 1326-1331. doi: 10.7498/aps.51.1326
    [19] 董贾福, 唐年益, 李伟, 罗俊林, 郭干诚, 钟云泽, 刘仪, 傅炳忠, 姚良骅, 冯北滨, 秦运文. HL-1M装置超声分子束注入等离子体穿透特性的诊断. 物理学报, 2002, 51(9): 2074-2079. doi: 10.7498/aps.51.2074
    [20] 神经网络的自适应删剪学习算法及其应用. 物理学报, 2001, 50(4): 674-681. doi: 10.7498/aps.50.674
计量
  • 文章访问数:  589
  • PDF下载量:  18
出版历程
  • 收稿日期:  2024-12-18
  • 修回日期:  2025-01-18
  • 上网日期:  2025-02-17
  • 刊出日期:  2025-04-05

/

返回文章
返回