attention-mechanism lstm-model seq2seq-model tensorflow2 trajectory-prediction vessel

Vesssel Trajectory Prediction

1，数据预处理

训练轨迹数据载入类

TrajectoryLoader.py 船舶轨迹数据载入类，包括用于训练的轨迹数据载入方法，用于各模型训练的getBatch方法。

row2array(row):行读取方法
将读入的csv文件的一行解析为船舶轨迹点数据，数据类型为 np.float32 训练用数据结构为五维数据：Δtime, Δlng, Δlat, sog, cog
loadTrajectoryData(file_name)
将file_name的csv文件中的船舶轨迹数据载入进轨迹数据类的trajectory变量中。船舶轨迹数据点结构为：Δtime, Δlng, Δlat, sog, cog。随后进行离差标准化归一化处理，normalization: (x - min)/(max - min) 用于归一化的数据保存在self.max_train_data and self.min_train_data
getBatchBP(batch_size, bp_step) 随机取一批用于BP模型训练的轨迹与真实点数据。轨迹长度为bp_step。取出的轨迹需要保证是连续的。 Returns: seq: shape of [batch_size, bp_step, 5]. next_point: shape of [batch_size, 5].
getBatchLSTM(batch_size, seq_length) 随机取一批用于LSTM模型训练的轨迹与真实点数据。轨迹长度为seq_length。取出的轨迹需要保证是连续的。 Returns: seq: shape of [batch_size, seq_length, 5].
next_point: shape of [batch_size, 5].
getBatchSeq2Seq(batch_size, encoder_lenght, decoder_lenght) 随机取一批用于LSTM模型训练的源轨迹与目标序列数据。轨迹长度为encoder_length和decoder_length。总轨迹需要是连续的。（这里seq_decoder的长度实际是decoder_length+1，因为seq_encoder的最后一位要用于输入） Returns: seq_encoder: shape of [batch_size, encoder_length, 5]. seq_decoder: shape of [batch_size, decoder_length+1, 5].

测试轨迹数据载入类

TestLoader.py 船舶轨迹数据载入类，包括用于测试的轨迹数据载入方法，用于各模型测试的getBatch方法。

row2array(row):行读取方法将读入的csv文件的一行解析为船舶轨迹点数据，数据类型为 np.float32 测试用数据包括绝对坐标，结构为七维数据：Δtime, Δlng, Δlat, sog, cog, lng, lat.
getTestBP(batch_size, bp_step): 随机取一批用于BP模型测试的轨迹与真实点数据。轨迹长度为bp_step。取出的轨迹需要保证是连续的。返回为测试序列与序列绝对坐标。 Returns: x_test: sequence for testing. [Δtime, Δlng, Δlat, sog, cog] x_coordinates: coordinates of seq. [lng, lat]
getTestLSTM(batch_size, seq_length): 随机取一批用于LSTM模型测试的轨迹与真实点数据。轨迹长度为seq_length。取出的轨迹需要保证是连续的。返回为测试序列与序列绝对坐标。 Returns: x_test: sequence for testing. [Δtime, Δlng, Δlat, sog, cog] x_coordinates: coordinates of seq. [lng, lat]
getTestSeq2Seq(batch_size, encoder_lenght, decoder_lenght): 随机取一批用于LSTM模型测试的源轨迹与目标序列数据。轨迹长度为encoder_length和decoder_length。总轨迹需要是连续的。返回为编码序列，编码序列绝对坐标，解码序列，解码序列绝对坐标。 Returns: seq_encoder_test: encoder sequence for testing. [Δtime, Δlng, Δlat, sog, cog]. seq_encoder_coordinates: coordinates of encoder seq. [lng, lat]. seq_decoder_test: decoder sequence for testing. [Δtime, Δlng, Δlat, sog, cog]. seq_decoder_coordinates: coordinates of decoder seq. [lng, lat].

2, 网路模型

LSTM

Model: "lstm"

Layer (type) Output Shape Param #

lstm_1 (LSTM) multiple 81408

output_layer (Dense) multiple 645

Total params: 82,053 Trainable params: 82,053 Non-trainable params: 0

超参数：batch_size, lstm_step, n_lstm lstm层：units = n_lstm, dropout=0.1 output层：units = 5

call: 初始状态为零张量直接输入lstm层，再输入输出层，返回即可。

Encoder

Model: "encoder"

Layer (type) Output Shape Param #

lstm (LSTM) multiple 68608

Total params: 68,608 Trainable params: 68,608 Non-trainable params: 0

超参数：batch_size, n_lstm lstm层：units = n_lstm, dropout=0.1, return_sequences=True, return_state=True output层：units = 5

call: 初始状态为零张量直接输入lstm层，返回lstm_out and states 即可。

Decoder

Model: "decoder"

Layer (type) Output Shape Param #

lstm_1 (LSTM) multiple 68608

output_layer (Dense) multiple 645

Total params: 69,253 Trainable params: 69,253 Non-trainable params: 0

超参数：batch_size, n_lstm lstm层：units = n_lstm, dropout=0.1, return_sequences=True, return_state=True output层：units = 5

call: 初始状态来自输入直接输入lstm层，返回lstm_out and states，lstm_out通过输出层返回输出和状态。

Attention

Attention layer whose function is 'dot'

Model: "attention" n_lstm = 128, attention_func = 'dot'

Layer (type) Output Shape Param #

Total params: 0 Trainable params: 0 Non-trainable params: 0

Attention layer whose function is 'general'

Model: "attention" n_lstm = 128, attention_func = 'general'

Layer (type) Output Shape Param #

dense (Dense) multiple 16512

Total params: 16,512 Trainable params: 16,512 Non-trainable params: 0

Attention layer whose function is 'concat'

Model: "attention" n_lstm = 128, attention_func = 'concat'

Layer (type) Output Shape Param #

dense (Dense) multiple 32896

dense_1 (Dense) multiple 129

Total params: 33,025 Trainable params: 33,025 Non-trainable params: 0

DecoderAttention

Model: "decoder_attention" n_lstm = 128, attention_func = 'general'

Layer (type) Output Shape Param #

attention (Attention) multiple 16512

lstm_1 (LSTM) multiple 68608

wc_layer (Dense) multiple 32896

output_layer (Dense) multiple 645

Total params: 118,661 Trainable params: 118,661 Non-trainable params: 0

超参数：batch_size, n_lstm, attention_func lstm层：units = n_lstm, dropout=0.1, return_sequences=True, return_state=True output层：units = 5

call: 初始状态来自输入注意力层输入：lstmout和encoder_output 直接输入lstm层，返回lstm_out and states，lstm_out通过输出层返回输出和状态。

3，网络训练

BPtrain.py

LSTMtrain.py

设置模型，训练参数，优化方法： n_lstm, seq_length, lstm_step learning_rate, batch_size, num_batches optimizer一般选择Adam
建立并初始化模型建立模型：lstm neural_net. 通过输入来预先制定输入形状随后可对网络进行summary.
设置tensorboard & checkpoint tensorboard用于可视化训练过程 checkpoint保存训练后的参数，便于测试时重载。
定义训练过程 step处理方法：将 (batch_size, seq_length, 5)的航迹数据处理按步输入的形式 (batch_size, seq_length - lstm_step+1, lstm_step*5) LSTM训练过程： loss为解码器输出序列和真实序列的MSE（这里只选择Δlng, Δlat二维数据）对编解码器参数进行优化
载入训练集进行训练实例化航迹数据载入类用StepProcess函数将航迹数据重构为每step步一个输入进行训练，每display_step个batch记录一个checkpoint。

Seq2Seqtrain.py

设置模型，训练参数，优化方法： n_lstm, encoder_length, decoder_length learning_rate, batch_size, num_batches optimizer一般选择Adam 注意，此处发现需要更多batch_num来对模型进行训练，目前估计大约需要10w
建立并初始化模型建立模型：encoder and decoder. 通过输入来预先制定输入形状随后可对网络进行summary.
设置tensorboard & checkpoint tensorboard用于可视化训练过程 checkpoint保存训练后的参数，便于测试时重载。
定义Seq2Seq训练过程 decoder段需要一个循环来实现时序预测，loss累加最后取平均。 loss为解码器输出序列和真实序列的RMSE（这里只选择 Δlng, Δlat二维数据）递归预测时将真实值用于预测（Scheduled Sampling有效性待验证）对编解码器参数进行优化
载入训练集进行训练实例化航迹数据载入类进行训练，每display_step个batch记录一个checkpoint。

AttentionSeq2Seqtrain.py

设置模型，训练参数，优化方法： n_lstm, encoder_length, decoder_length learning_rate, batch_size, num_batches optimizer一般选择Adam
建立并初始化模型建立模型：encoder_a and decoder_a. 通过输入来预先制定输入形状随后可对网络进行summary.
设置tensorboard & checkpoint tensorboard用于可视化训练过程 checkpoint保存训练后的参数，便于测试时重载。
定义Attention-Seq2Seq训练过程 decoder段需要一个循环来实现时序预测，loss累加最后取平均。 loss为解码器输出序列和真实序列的MSE（这里只选择Δlng, Δlat二维数据）递归预测时将真实值用于预测（Scheduled Sampling有效性待验证）同时随着预测的进行，更新历史航迹数据。对编解码器参数进行优化
载入训练集进行训练实例化航迹数据载入类进行训练，每display_step个batch记录一个checkpoint。

4，模型测试

TestPoints.py

多点预测测试，测试模型的实际预测能力

创建模型，重载参数重载模型:lstm, encoder, decoder, encoder_a, decoder_a
定义预测方法
- TestSeq2Seq 进行Seq2Seq轨迹预测，返回平均RMSE loss。
- TestSeq2SeqAttention 进行AttentionSeq2Seq轨迹预测，返回平均RMSE loss。
- TestLSTM 进行LSTM轨迹预测，用时序循环实现多点预测。返回平均RMSE loss。
载入测试数据，设定测试参数载入测试轨迹集，设置进行预测的源序列长度和目标序列长度
进行预测随机获取batch_size的连续轨迹序列，包括用于预测的源序列，用于验证的目标序列用于输出绝对坐标。分别用LSTM, Seq2Seq, AttentionSeq2Seq进行预测，loss为平均RMSE。

TestVisual.py

预测点可视化测试

创建模型，重载参数重载模型:lstm, encoder, decoder, encoder_a, decoder_a
定义预测方法
- TestSeq2Seq 进行Seq2Seq轨迹预测，用时序循环进行预测，保存预测点返回预测点和平均loss Returns: pred [np.array(pred)]: The prediction of points. shape of [seq_length, 5]. loss [tensor]: Root Mean Squre Error loss of prediction of points.
- TestSeq2SeqAttention 进行AttentionSeq2Seq轨迹预测，用时序循环进行预测，保存预测点返回预测点和平均loss Returns: pred [np.array(pred)]: The prediction of points. shape of [seq_length, 5]. loss [tensor]: Root Mean Squre Error loss of prediction of points.
- TestLSTM 进行LSTM轨迹预测，用时序循环进行预测，保存预测点返回预测点和平均loss Returns: pred [np.array(pred)]: The prediction of points. shape of [seq_length, 5]. loss [tensor]: Root Mean Squre Error loss of prediction of points.
载入测试数据，设定测试参数载入测试轨迹集，设置进行预测的源序列长度和目标序列长度。随机获取batch_size的连续轨迹序列，包括用于预测的源序列，用于验证的目标序列。
进行预测分别用LSTM, Seq2Seq, AttentionSeq2Seq模型进行预测，loss为平均RMSE，结果打印。预测结果分布存于pred_lstm, pred_seq2seq, pred_aseq2seq，用于可视化。
绝对坐标恢复与可视化分布对源序列，真实目标序列，预测目标训练进行恢复与可视化。源坐标：载入，去归一，转为list，用simplekml可视化。真实坐标：载入，去归一，转为list，用simplekml可视化。预测坐标：载入，去归一，转为list，相对坐标转为绝对坐标，用simplekml可视化。

About

lstm-rnn, seq2seq model and attention-seq2seq model for vessel trajectory prediction.

attention-mechanism lstm-model seq2seq-model tensorflow2 trajectory-prediction vessel

Languages

Language:Python 100.0%

Vesssel Trajectory Prediction

1， 数据预处理

训练轨迹数据载入类

测试轨迹数据载入类

2, 网路模型

LSTM

Encoder

Decoder

Attention

DecoderAttention

3，网络训练

BPtrain.py

LSTMtrain.py

Seq2Seqtrain.py

AttentionSeq2Seqtrain.py

4，模型测试

TestPoints.py

TestVisual.py

About

Languages

1，数据预处理