文件名称:LaTextGAN:使用LaTextGAN生成假特朗普推文
文件大小:6.91MB
文件格式:ZIP
更新时间:2024-04-23 22:27:43
deep-learning neural-network lstm gan autoencoder
LaTextGAN 对于这个项目,我们尝试使用的LaTextGAN方法生成唐纳德·J·特朗普风格的新颖推文。 LaTextGAN背后的想法是从连续的低维空间生成新句子,而不是直接处理离散文本。 Donahue和Rumshisky通过首先在给定的数据集上训练AE来实现此目的,从而使编码器能够从中产生低维的句子嵌入。 然后,生成器的任务是从该学习的潜在空间中创建新颖的样本,这些样本可以由AEs解码器解码回句子。 在训练期间,鉴别器必须正确分类来自编码器(真实样本)和生成器(伪样本)的句子嵌入。 下图显示了原始架构的示意图。 由于AE正在处理顺序数据,因此使用LSTM网络读取(编码器)和重建(解码器)语句。 正如提出的,GAN已实现为原始Wasserstein GAN的改进变体 。 改进后的版本直接使鉴别器的梯度范数相对于其输入最多为1。 该惩罚代替了原始WGAN中用于实施Lipsch
【文件预览】:
LaTextGAN-main
----Latent Space Images()
--------Standard_LaTextGAN_Remove_Rare_Words.png(450KB)
--------Stacked_LaTextGAN_Remove_Rare_Words.png(446KB)
--------Bidirectional_LaTextGAN_Remove_Rare_Words.png(488KB)
--------README.md(1B)
--------Standard_LaTextGAN_All_Words.png(477KB)
--------Bidirectional_Stacked_LaTextGAN_Remove_Rare_Words.png(448KB)
----Modules()
--------standard_latextgan_evaluation.py(5KB)
--------ae.py(7KB)
--------bidirectional_sae_training.py(9KB)
--------ae_training.py(9KB)
--------standard_latextgan_training.py(10KB)
--------bidirectional_stacked_latextgan.py(3KB)
--------README.md(1B)
--------bidirectional_stacked_latextgan_evaluation.py(5KB)
--------bidirectional_stacked_latextgan_training.py(12KB)
--------bidirectional_sae.py(9KB)
--------standard_latextgan.py(3KB)
----LaTextGAN_Schematic.jpg(323KB)
----environment.yml(201B)
----README.md(2KB)
----Dataset()
--------tweets_01-08-2021.json(16.43MB)
--------README.md(134B)