代码之家 › 专栏 › 技术社区 › loretoparisi

火炬模型由弦计算

torch pytorch

loretoparisi · 技术社区 · 5 年前

我对我的工作进行评估 torch 从文本文件加载批处理的模型:

def batchify(data, bsz):
    nbatch = data.size(0)
    data = data.narrow(0, 0, nbatch * bsz)
    data = data.view(bsz, -1)
    return data

def load_file(path, vocab, direction):
    lines = open(path).readlines()
    data = list(''.join(lines))
    idx = vocab['char'].map(data)
    if direction == 'backward': idx = idx[::-1]
    return torch.tensor(idx)

def load_data(path, vocab, direction):
    data = load_file(path, vocab, direction)
    yield data

这很好用:

eval_file_or_dir = os.path.join(BASE_PATH,'shakespeare.txt')
data = load_data(eval_file, vocab, direction)
if isinstance(data, GeneratorType):
    data = list(data)
    data = data[0]
batches = batchify(data, batch_size)

我得到了 torch.Size([100, 6])

现在,我想从字符串加载数据,所以我写了

def load_text(text, vocab, direction):
    buf = io.StringIO(text)
    lines = buf.readlines()
    data = list(''.join(lines))
    idx = vocab['char'].map(data)
    if direction == 'backward': idx = idx[::-1]
    yield torch.tensor(idx)

但它并没有像预期的那样起作用:

data = load_text(text, vocab, direction)
if isinstance(data, GeneratorType):
    data = list(data)
    data = data[0]
batches = batchify(data, batch_size)
print(batches, batches.size())

我得到一个空的 tensor :

tensor([], size=(100, 0), dtype=torch.int64) torch.Size([100, 0])

0 回复 | 直到 5 年前

推荐文章

ÐÐ½Ð´ÑÐµÐ¹ ÐÑÐ¾Ð½ÑÐºÐ¸Ð½ · 没有名为“torch.utils”的模块

1 年前

Rotacional · 获取矩阵中的方向元素

1 年前

Amir Jalilifard · 为什么完全相同的向量之间的火炬余弦相似性给出的相似性为零而不是一?

2 年前

Rocket · 错误:default_collate:批处理必须包含张量、numpy数组、数字、dicts或列表;找到的对象

2 年前

MJK · 我想知道为什么我的代码在PyTorch中使用编译时性能较低

2 年前

Nikolay Dyankov · 从Dockerfile运行命令时出错,但从容器运行良好

3 年前

BladedGnome29 · RuntimeError:形状“[1,1,223232]”对于大小为446464的输入无效

3 年前

Qinqing Liu · 如何构造一个三维张量,其中每个二维子张量是PyTorch中的对角矩阵?

8 年前

Elias E. · pytorch神经网络中的交叉熵损失。交叉熵()

8 年前

Wasi Ahmad · 参数维数对聚集函数的影响

8 年前