|
|
1
6
我还在读《Python深度学习》一书,书中使用了Keras。这是我对这个问题的解答。首先,我尝试以下代码:
但有一个错误: ResourceExhaustedError . 因为“x_train”中有25000个样本,所以很难将它们全部嵌入我的旧笔记本中。接下来我尝试嵌入“x_train”的前100个样本,这是有意义的。 代码和结果显示在这里。
请注意,在投影仪中,“Points:100”表示有100个样本,“Dimension:64000”表示每个样本的嵌入向量长度 一 样本是64000。一个样本中有500个单词,如“max_len=500”,每个单词有一个128_dim向量,因此500*128=64000。 |
|
2
1
是的,这是正确的,你需要提供
什么
使用
看一看 documentation 获取关于这些论点的最新信息。 |
|
|
3
1
我只是问自己同样的问题。从文档来看,不太清楚“嵌入数据”应该是什么。但它是一个要嵌入的单词列表,或者更确切地说是它们的索引,这是有道理的。 但我对格式有点困惑。通过使用keras标记器进行标记,我有一个“单词索引”,其中包含我词汇表中所有单词的一个数字,其中最常见的是 maxwords 使用条目。标记器为我提供从0到0的整数列表 maxwords 或者是一袋热编码的单词。然后我将这些序列填充到 麦克斯伦 .
然后,我创建了一个从嵌入层开始的模型:
所以 max_words 是我的词汇量,一个热编码单词/文本的大小, 嵌入_dim 是图层输出的大小,并且 麦克斯伦 是序列的长度,即句子中的字数,通过填充保持不变。 单词索引中的数字是“嵌入数据”应该得到的吗? 当我输入“仅”一个numpy数组时,它列出了任意数量的单词索引
我得到了这个错误:
在我的例子中,100是序列的长度。这令人困惑。因为我想想象单个单词,而不是句子或文本,不是吗?显然,回调函数想要向层提供一个或多个序列。 那么,我应该如何对我的“皇后”、“国王”、“女人”、“男人”标记进行编码,以便我能看到语义关系(希望如此)? 或者更一般地说:如何对所有词汇元素进行概述,以发现单独培训的嵌入的总体趋势? |
|
|
4
0
这里有一个
example
对基本MNIST卷积神经网络分类器使用嵌入。这个
以下是带有评论的链接脚本。首先,他们从基本的MNIST设置开始。
现在为tensorboard创建了元数据。对于此分类任务
现在定义tensorboard回调。请注意,“特征”指的是感兴趣的嵌入层,在模型构建期间命名。这个
下一层名为“features”。
|
|
|
Cam · Pandas列表日期到日期时间 9 月前 |
|
|
LMC · Numpy数组布尔索引以获取包含元素 10 月前 |
|
|
vr8ce · 非成对标记中特定字符的正则表达式 10 月前 |
|
|
ShaAnder · 为什么sqllachemy返回的是类而不是字符串 10 月前 |
|
|
Pernoctador · Python映射可以复制吗?我需要参考地图 11 月前 |