Spaces:

HassounLab
/

FLARE

Sleeping

App Files Files Community

FLARE / massspecgym /models /retrieval /fingerprint_ffn.py

yzhouchen001

msgym

e689ac2 3 months ago

raw

history blame contribute delete

2 kB

	import typing as T

	import torch
	import torch.nn as nn
	import torch.nn.functional as F
	from torch_geometric.nn import MLP

	from massspecgym.models.base import Stage
	from massspecgym.models.retrieval.base import RetrievalMassSpecGymModel
	from massspecgym.utils import CosSimLoss


	class FingerprintFFNRetrieval(RetrievalMassSpecGymModel):
	def __init__(
	self,
	in_channels: int = 1000, # number of bins
	hidden_channels: int = 512, # hidden layer size
	out_channels: int = 4096, # fingerprint size
	num_layers: int = 2,
	dropout: float = 0.0,
	norm: T.Optional[str] = None,
	**kwargs
	):
	super().__init__(**kwargs)

	self.ffn = MLP(
	in_channels=in_channels,
	hidden_channels=hidden_channels,
	out_channels=out_channels,
	num_layers=num_layers,
	dropout=dropout,
	norm=norm
	)

	self.loss_fn = CosSimLoss()

	def forward(self, x: torch.Tensor) -> torch.Tensor:
	x = self.ffn(x)
	x = F.sigmoid(x) # predict proper fingerprint
	return x

	def step(
	self, batch: dict, stage: Stage = Stage.NONE
	) -> tuple[torch.Tensor, torch.Tensor]:
	# Unpack inputs
	x = batch["spec"]
	fp_true = batch["mol"]
	cands = batch["candidates"]
	batch_ptr = batch["batch_ptr"]

	# Predict fingerprint
	fp_pred = self.forward(x)

	# Calculate loss
	loss = self.loss_fn(fp_true, fp_pred)

	# Evaluation performance on fingerprint prediction (optional)
	self.evaluate_fingerprint_step(fp_true, fp_pred, stage=stage)

	# Calculate final similarity scores between predicted fingerprints and corresponding
	# candidate fingerprints for retrieval
	fp_pred_repeated = fp_pred.repeat_interleave(batch_ptr, dim=0)
	scores = nn.functional.cosine_similarity(fp_pred_repeated, cands)

	return dict(loss=loss, scores=scores)