-
Notifications
You must be signed in to change notification settings - Fork 0
/
index.js
71 lines (60 loc) · 2.1 KB
/
index.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
const fs = require('fs');
const path = require('path');
const client = require('cheerio-httpcli');
const PDFDocument = require('pdfkit');
const sizeOf = require('image-size');
// usage()
if (process.argv.length < 3) {
console.error('Usage : node index.js [SlideShare URL]');
process.exit(1);
}
// ダウンロードしたjpgの一時置き場
const tmpDir = '/tmp/topdftemp/';
const tmpPath = fs.mkdtempSync(tmpDir);
// ダウンロードマネージャーの設定
client.download.on('ready', stream => {
const jpgName = path.basename(stream.url.pathname);
stream.pipe(fs.createWriteStream(`${tmpPath}/${jpgName}`));
}).on('error', err => {
console.error(err.url + 'をダウンロードできませんでした: ' + err.message);
}).on('end', () => {
// ダウンロード待ちがなくなったらPDF作成開始
createSlidePdf();
console.log(`${tmpPath}/output.pdf`);
});
// 並列ダウンロード制限の設定("3"が初期設定らしい)
//client.download.parallel = 3;
// スクレイピング開始
client.fetch(process.argv[2]).then(result => {
result.$('div.slide_container > section.slide > img').download('data-full');
}).catch(err => {
console.log(err);
}).finally(() => {
console.log('done');
});
/**
* スライドのPDFをつくる関数
*/
const createSlidePdf = () => {
// ページ順でソートしてjpg一覧を取得
const re = /-([0-9]+)-[0-9]+\.jpg$/;
const jpglist = fs.readdirSync(tmpPath).sort((a, b) => {
const aRe = (re.exec(a))[1];
const bRe = (re.exec(b))[1];
return aRe - bRe;
});
// jpgとpdfでサイズを合わせる
const dimensions = sizeOf(`${tmpPath}/${jpglist[0]}`);
const doc = new PDFDocument({
size: [dimensions.width, dimensions.height]
});
// pdfを生成
doc.pipe(fs.createWriteStream(`${tmpPath}/output.pdf`));
jpglist.forEach((element, index) => {
if (index !== 0) {
doc.addPage();
}
doc.image(`${tmpPath}/${element}`, 0, 0);
});
doc.end();
}